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美国 麻 省 理工 学 院 博士 后 ， 加 拿 大 
蒙特 利 尔 理工 学 校 应 用 数学 博士 ， 
主攻 博弈 论 和 资源 分 配 问题 。 现 于 
瑞士 洛桑 联邦 理工 大 学 教授 数学 和 
计算 机 课程 ， 在 校 主持 创办 数学 、 
物理 学 和 计算 机 科学 的 视频 教育 项 
目 Wandida。 他 自 创 了 数学 和 计算 
机 科学 科普 博客 和 YouTube 频 道 
“Science4All”， 著 有 多 部 数学 
及 计算 机 理论 著作 。 
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巴黎 七 大 组 合 数学 博士 ， 曾 于 波 尔 
多 、 里 昂 、 格 拉 茨 等 地 大 学 工作 ， 
现 为 巴黎 古 斯 塔 夫 ' 埃菲尔 大 学 计 
算 机 系 助 理 教授 。 业 余 时 间作 为 科 
普 作 家 ， 主 要 撰写 了 《计算 的 极限 》 
系列 等 与 数学 、 物 理 及 计算 机 科学 
相关 的 科普 文章 ， 也 进行 国外 科普 
文章 的 译 介 ， 曾 为 平面 媒体 以 及 果 
壳 网 、 赛 先生 等 网 络 媒体 供稿 。 此 
前 译作 有 《 玩 不 够 的 数学 2: 当 数 学 
遇 上 游戏 》《 数 学 速 览 : 即时 掌握 
的 200 个 数学 知识 》《 大 图 景 : 论 
生命 的 起 源 、 意 义 和 宇 宙 本 身 》。 
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BF IV. G201 
中 国 版 本 图 书馆 CIP 数 据 核 字 (2020) 第 249338 号 
内 À À € 
本 书 从 数学 、 哲 学 、 计 算 机 科学 、 神 经 科学 和 人 工 智能 等 角度 , 全 面前 述 了 贝 叶 斯 理 
论 背 后 的 基础 知识 、 思 维 方式 和 丰富 哲理 。 贝 叶 斯 定理 一 旦 与 算法 相 结合 , 就 不 再 是 一 套 
枯燥 的 数学 理论 或 认识 论 , 而 是 变 成 了 应 用 广泛 的 知识 宝库 , 催生 了 众多 现代 数学 定理 ， 






































以 及 令 人 称道 的 实践 成 果 。 作者 一 改 传统 的 探讨 模式 , 不 仅 展 现 了 贝 叶 斯 理论 背后 的 科学 
思想 , 还 阐述 了 它 与 人 类 思维 之 间 的 深刻 关系 , 并 对 相关 领域 和 人 工 智能 的 发 展 进行 了 展 
望 。 本 书 适合 喜爱 数学 、 算法、 机 器 学 习 、 人 工 智 能 、 逻辑 学 和 哲学 的 大 众 读者 阅读 , 读者 
无 须 过 多 数学 和 算法 知识 就 能 读 懂 。 
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你 拖 着 沉重 的 行李 ， 坐 火车 来 到 一 个 小 城市 ， 下 了 和 车 就 直接 走向 火车 站 前 的 
出 租车 站 ,那里 只 有 一 辆 车 。 不 巧 ， 正 在 你 走 过 去 的 关头 ， 男 一 位 游客 捷足先登 ， 
出 租车 就 这 样 在 你 的 眼皮 底下 开 走 了 。 从 这 场 遭 遇 中 ， 你 能 得 出 什么 结论 ? 这 座 
城市 似乎 还 是 有 出 租车 的 ( 毕竟 这 种 规模 的 城市 其 实 不 是 总 有 出 租车 的 )， 所 以 ， 
如 果 你 耐心 等 待 ， 说 不 定 就 会 有 另 一 辆 车 开 过 来 。 或 者 说 ， 整 个 城市 没 多 少 出 租 
车 ， 你 刚好 错过 一 辆 ， 因 为 城市 很 小 ， 这 样 的 好 事 大 概 不 会 接二连三 地 发 生 。 这 
两 种 解释 都 对 ， 但 选择 哪 一 种 就 取决 于 你 在 下 火车 前 知道 的 〈 或 者 说 相信 的 ) 是 
什么 。 

这 位 造访 未 知 城市 的 旅行 者 对 出 租车 的 数目 进行 了 推测 ， 然 后 根据 观察 结果 
修改 这 些 推测 。 这 种 做 法 跟 刚 降生 到 这 个 未 知 世 界 的 婴儿 ， 或 者 思索 为 什么 太阳 
每 天 早上 都 会 升 起 的 研究 人 员 ( 他 们 会 惊叹 其 他 人 居然 对 此 感到 理所当然 ) 所 做 
的 没 多 大 差别 。 他 们 都 在 探索 世界 ， 提 出 假设 并 根据 观察 结果 修正 这 些 假设 。 

从 经 验 中 能 得 到 什么 教训 ?如 何 才 能 认识 这 个 世界 ? 黄 黎 原 (音译 ) 的 这 本 
著作 和 希望 我 们 思考 的 正 是 这 些 问 题 。 

这 些 问 题 正 好 概括 了 超过 一 个 世纪 的 争论 : 对 于 某 个 假说 ， 能 否 赋予 它 一 个 
衡量 其 真实 性 的 数值 ? 对 于 某 些 人 ， 比 如 汉 斯 ， 赖 欣 巴 哈 来 说 ， 这 正 是 发 展 概率 
论 的 目的 。 特 别 是 ， 所 有 证 实 某 个 假说 的 观察 结果 都 会 提高 这 个 假说 的 正确 性 的 
概率 ， 比 如 每 看 到 一 只 黑 乌 鸦 都 会 提高 “所 有 乌鸦 都 是 黑 的 ”这 个 假说 为 真 的 概 
率 。 对 于 其 他 人 ， 比 如 卡尔 波 普尔 来 说 ， 赋 予 这 种 假说 的 数值 只 是 一 种 幻觉 。 
看 到 一 只 黑 乌 猩 ， 我 们 只 能 断定 “所 有 乌鸦 都 是 黑 的 ”这 个 假说 仍然 吻合 我 们 的 
观察 结果 。 

处 于 这 场 争论 中 心 的 是 一 个 简单 得 出 乎 意料 的 公式 ， 也 就 是 贝 叶 斯 公式 一 一 
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“智慧 方程 ”。 这 个 公式 能 做 的 ， 就 是 让 我 们 在 获得 某 个 观察 结果 之 后 ， 计 算 应 该 
赋予 某 个 假说 的 概率 一 一 所 以 赖 欣 巴 哈 说 得 有 道理 ; 但 前 提 必 须 是 在 观察 之 前 就 
知道 怎么 向 这 个 假说 赋予 概率 一 一 所 以 波 普尔 说 得 也 有 道理 。 

尽管 可 以 说 ， 这 个 问题 在 20 世纪 似乎 已 被 解决 ( 当时 的 胜利 者 是 波 普尔 )， 
然而 ， 目 前 数据 收集 技术 的 演变 让 人 们 开始 重新 审视 这 个 问题 。 在 20 世纪 ， 如 果 
我 们 相信 白 乌鸦 存在 ， 那 么 观察 到 三 只 乌鸦 全 是 黑色 的 事实 可 以 被 解释 为 巧合 。 
在 今天 ， 当 我 们 观察 100、1000 甚至 1 亿 只 乌鸦 ， 且 看 到 它们 都 是 黑色 的 时 候 ， 
我 们 就 需要 某 种 勇气 ， 甚 至 是 某 种 偏执 ， 才 能 断言 不 一 定 所 有 乌鸦 都 是 黑 的 ， 而 
观察 结果 完全 一 致 只 是 偶然 。 至 少 我 们 必须 退让 ， 承 认 在 所 有 乌鸦 之 中 ， 有 一 大 
部 分 都 是 黑 的 ， 至 于 白 乌鸦 只 能 作为 例外 。 贝 叶 斯 公式 指出 的 先 验 假说 问题 使 人 
们 反对 和 赖 欣 巴 哈 的 观点 ， 但 今天 数据 的 泛滥 已 经 冲淡 了 这 种 反对 。 相 对 的 是 ， 其 
他 问题 出 现 了 : 这 些 数 据 是 怎么 收集 而 来 的 ? 收集 数据 的 方法 会 不 会 引 和 对白 乌 
鸦 的 认识 偏差 甚至 歧视 ”我 们 再 一 次 观察 到 技术 的 演变 ， 尤 其 是 科学 研究 中 的 技 
术 ， 如 何 改变 了 科学 哲学 提出 的 问题 。 

正 是 这 一 点 令 这 本 书 更 加 引人入胜 。 这 本 书写 于 一 个 翻天 覆 地 的 时 代 ， 技 术 
的 演变 让 我 们 重新 审视 贝 叶 斯 公式 以 及 它 在 知识 大 厦 中 的 位 置 。 

这 本 书 也 写 在 了 一 个 传播 方式 改变 了 我 们 谈论 科学 方式 的 时 代 。 受 到 在 线 视 
频 风 潮 的 影响 ， 作 者 找到 了 谈论 科学 的 新 方式 ， 既 严 首 认真 又 九 娓 道 来 ， 并且 擅 
长 用 例子 照 亮 最 抽象 的 问题 。 
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"UK: SITE 
法 国 国 家 信息 与 自动 化 研究 所 研究 员 ， 若 有 《计算 进化 史 》 
巴黎 BE CRIME) 高 等 师范 学 校 教授 












































本 书 中 对 众多 概念 的 讨论 与 推论 均 为 作者 个 人 观点 ， 不 代表 人 民 邮 电 出 版 社 的 立场 。 











目录 


第 1 章 初始 之 旅 
学 生 问 难 
走 上 贝 叶 斯 主义 的 道路 
统一 的 知识 哲学 
科学 方法 的 蔡 代 
客观 性 的 迷梦 
本 书 的 目标 


第 2 章 贝 叶 斯 定理 
小 孩 迹 题 
ads : 堆 尔 问题 
Bex - 克拉 克 的 审判 
被 判 非法 的 贝 叶 斯 主义 
贝 叶 斯 定理 
贝 叶 斯 公式 的 组 成 部 分 
贝 叶 斯 主义 对 化 验 结果 
yin 
Aoi FER Y ! 
几 句 鼓励 的 话 




























































































解读 


主义 对 萨 莉 ， 克拉 克 的 辩护 


第 3 章 ”从 逻辑 上 来 说 …… 








两 种 思考 模式 
逻辑 的 规则 
Q 的 背面 都 是 蓝 色 的 吗 ? 


量词 与 谓词 




















重新 解释 亚 里 士 多 德 三 段 论 








公理 化 方法 


柏拉图 主义 者 对 阵 直觉 


EX 











Junge * 
BARSE 
矛盾 理论 走向 共存 











第 4 章 必须 ( 正确 地 ) 泛 化 ! 


苏格兰 的 黑色 绵羊 


第 5 章 


认识 论 简 史 

行星 研究 简 史 

科学 与 波 普尔 背道而驰 ? 
频率 主义 * 

反对 p 值 的 统计 学 家 
p 值 操控 
统计 学 课本 讲 了 什么 
智慧 方程 

渐进 学 习 

再 谈 爱 因 斯 坦 


荣耀 归于 偏见 

琳 达 问题 

用 偏见 解释 琳 达 问题 * 
偏见 是 必要 的 

xked 的 太阳 

用 偏见 解释 xkcd 

用 偏见 为 萨 莉 ， 克 拉克 辩护 
用 偏见 对 抗 伪 科 学 

偏见 拯救 科学 


































































































贝 叶 斯 主义 者 对 万 物 均 有 偏见 











错误 的 偏见 
偏见 与 道德 








第 6 章 贝 叶 斯 主义 的 “先知 ” 









































一 段 起 伏 跌宕 的 历史 
概率 论 的 起 源 
神秘 的 托马斯 ， 贝 叶 基 

拉 普 拉 斯 ， 贝 叶 斯 主义 之 父 
拉 普 拉 斯 接续 法 则 




















贝 叶 斯 主义 的 寒冬 

贝 叶 斯 主义 拯救 盟 军 
频率 主义 海洋 中 的 贝 叶 基 
被 实干 者 拯救 的 贝 叶 斯 主义 


















































44 
45 
46 
47 
50 
51 
52 
53 
55 
56 


58 
58 
59 
61 
62 
63 
64 
65 
66 
68 
71 
74 


76 
76 
77 
78 
79 
81 
84 
85 
88 
89 





vi | 贝 叶 斯 的 博弈 : 数学 、 思 维 与 人 了 





贝 叶 斯 主义 的 胜利 
贝 叶 斯 无 处 不 在 























第 7 章 ”所罗门 诺 夫 妖 


非 人 类 ， 也 非 机 器 


算法 基础 


“模式 ”是 什么 ? 
所 罗 门 诺 夫 复杂 度 
算法 与 概率 的 联姻 


所 罗 门 诺 夫 的 偏见 * 
贝 叶 斯 主义 造就 所 罗 门 诺 夫 妖 * 103 














所 罗 门 诺 夫 完备 性 





102 


104 


所 罗 门 诺 夫 归纳 法 的 不 可 计算 性 105 





所 罗 门 诺 夫 不 完备 性 











对 实用 的 追求 
第 8 章 ”保守 秘密 
保密 


今天 的 密码 学 





























随机 调查 问卷 























组 合 健壮 性 


隐私 损失 的 可 加 性 
在 实践 中 可 行 不 通 ! 





同 态 加 密 





随机 调查 的 私密 性 
差分 隐私 的 定义 * 
拉 普 拉 斯 型 机 抽 

















用 贝 叶 斯 主义 破译 密码 


! 


第 9 章 博弈 已 成 定局 


exp 
平分 还 是 独占 
贝 叶 斯 式 游说 
谢 林 点 
混合 均衡 

贝 叶 斯 博 穿 






































贝 叶 斯 机 制 设计 * 





迈 尔 森 的 拍卖 


107 
108 


110 
110 
111 
113 
114 
116 
117 
119 
120 
121 
122 
123 


125 
125 
127 
128 
131 
132 
134 
135 
137 











贝 叶 斯 主义 的 社会 影响 138 


第 10 章 达尔 文 遇 上 贝 叶 斯 140 






































幸存 者 偏差 140 
加 利 福 尼 亚 的 五 彩 蜥 蝎 141 
ERR - 沃 尔 泰 拉动 力学 * 142 
遗传 算法 144 
构筑 自己 的 意见 ? 145 
单个 科学 家 并 不 可 靠 146 
诉 诸 权威 148 
科学 共识 150 
“标题 党 ” 151 
市 场 的 预测 能 152 
金融 泡沫 155 
第 11 章 ， 指数 超 乎 直觉 157 
那些 大 得 过 分 的 数 157 
计算 的 “玻璃 天 花 板 ” 159 
指数 爆炸 160 
印度 - 阿拉 伯 数 字 的 魔法 163 
本 福特 定律 164 
对 数 尺 度 166 
对 数 167 











贝 叶 斯 公式 抢 到 了 哥 德 尔 奖 168 
贝 叶 斯 主义 者 的 度假 方法 170 

































































技术 奇 点 172 
第 12 章 挥动 奥 卡 姆 的 剃刀 174 
上 星期 四 …… 174 
足球 里 没有 命中 注定 176 
过 度 诠释 的 灾难 177 
追寻 简单 性 的 复杂 旅程 180 
世事 并 非 一 贯 简单 181 
交叉 验证 183 
蒂 布 斯 兰 尼 正则 化 185 
稳健 优化 186 
用 贝 叶 斯 方法 解决 过 度 拟 合 *” 187 
只 有 贝 叶 斯 推断 才 是 可 容许 的 * 188 



































xu 
< 
B: 










































































































































































































































































奥 卡 姆 剃刀 来 自 贝 叶 斯 主义 ! 189 沃 巧 斯 坦 度量 236 
第 13 章 “真相 在 撒谎 191 SEDE 2) 
公立 医院 还 是 私人 诊所 ? 191 #16% 记忆 缺陷 241 
相关 并 非 因果 193 数据 的 价值 241 
寻找 混杂 因素 195 数据 泛滥 242 
回归 平均 197 而 所 问题 243 
HHE 198 信息 洪流 的 高 速 处 理 244 
内 生 分 层 的 失效 199 卡尔 曼 滤 波 器 246 
进行 随机 化 吧 ! 201 面 对 大 数据 的 人 类 大 脑 247 
苏格兰 黑色 绵羊 的 回归 203 擦 除 记忆 创伤 248 
猫 是 什么 ? 204 虚假 回忆 250 
诗 性 自然 主义 206 用 贝 叶 斯 帮助 记忆 252 
第 14 章 又 快 又 ( 足够 ) 好 208 i ee - 
P , iVE ELENE 5 
a e » 应 该 学 什么 ,应 该 教 什么 ? 256 
z 的 近似 21 %17% 睡梦 是 你 的 顾问 258 
渐 近 展开 212 想法 从 何 而 来 ? 258 
实用 主义 的 限制 213 人 工 智能 的 创新 艺术 259 
图 灵 的 机 需 学 习 213 隐 含 狄 利克 雷 分 布 260 
实用 贝 叶 斯 主义 216 向 LDA 施 以 援手 的 中 餐馆 262 
次 线性 算法 218 蒙特 卡 罗 模 拟 263 
思考 的 多 种 模式 220 随机 梯度 下 降 法 265 
迈进 后 严谨 阶段 ! 221 伪 随 机 数 266 
见 叶 斯 的 近似 222 重要 性 抽样 267 
第 15 章 不 走运 导致 的 错误 po PERE LDA 一 臂 之 力 267 
FiveThirtyEight H 2016 年 美国 is : d 
总 统 大 选 224 DUKAN 9 
量子 力学 是 概率 性 的 吗 ? 25 jn i ore o 
混沌 理论 358 ha PATH - 黑 廷 斯 抽样 273 
无 法 预测 的 确定 性 自动 机 。 229 aa a 
热力 学 à MCMC 与 认 知 偏差 276 
P PH 对 比 散 度 与 梦 278 
香农 的 最 优 压缩 233 第 18 章 抽象 方法 超出 常理 的 
香农 匈 余 度 234 有 效 性 280 


KL 散 度 235 深度 学 习 ， 真 的 行 ! 280 





vii | 贝 叶 斯 的 博弈: 数学 、 思 维 与 人 工 智能 









































































































































特征 学 习 282 (工具 主义 的 ) 非 实在 论 有 用 吗 ? 325 
单词 的 向 量 表示 283 大 脑 之 外 的 世界 是 否 存在 ? 327 
指数 式 的 表达 能 力 * 285 猫 存 在 于 二 进 制 代码 中 吗 ? 327 
复杂 性 的 涌现 286 所 罗 门 诺 夫 妖 的 非 实 在 论 329 
柯 尔 莫 哥 洛 夫 精 致 度 * 287 — je : 
精致 度 就 是 所 罗 门 诺 夫 的 rein COUR 
MAP 估计 1 * 288 发 散 级 数 的 奇闻 330 
本 内 特 的 逻辑 深度 290 但 那 是 错 的 ， 不 是 吗 ? 332 
数学 的 深度 292 军官 学 生 
数学 的 简洁 性 293 我 的 亚洲 之 旅 335 
数学 的 模块 性 294 都 是 因为 魔鬼 获得 了 权力 ? 336 
"MUN N 故事 比 数字 更 有 效果 337 
第 19 章 贝 叶 斯 大 脑 297 心理 作用 339 
大 脑 不 可 思议 297 意识 形态 的 达尔 文 式 演化 340 
山峰 还 是 山谷 ? 299 心理 作用 有 用 342 
视 错觉 300 视频 网 站 的 魔法 344 
运动 的 感知 301 旅途 仍 在 继续 344 
贝 叶 斯 抽样 302 
归纳 间 题 3 第 22 章 超越 贝 叶 斯 主义 346 
学 习 如 何 学 习 305 贝 叶 斯 不 考虑 道德 哲学 346 
抽象 的 恩赐 306 自然 (选择 得 到 的 ) 道德 347 
婴儿 都 是 天 才 308 无 意识 的 道德 sa 
语言 308 W PIKE 352 
学 习 计数 310 大 多 数 人 的 道德 ? 353 
心智 理论 311 道德 义务 论 355 
先天 还 是 后 天 ? 312 知识 是 合理 的 目的 吗 ? 357 
"UN 效用 主义 359 
第 20 章 ”一切 都 是 虚构 314 贝 叶 斯 结果 论 者 361 
柏拉图 的 洞穴 314 结语 363 
反 实 在 主义 315 
生命 是 否 存在 ? 316 致谢 dps 
货币 是 否 存在 ? 317 “人 名 对 照 表 366 
目的 论 ， 科 学 中 的 一 条 死路 ? — 320 
关于 现实 ， 图 灵 — 丘 奇 论题 注释 和 推荐 阅读 373 








有 何 说 法 ? 324 


概率 论 本 质 上 不 过 是 化 为 计算 的 常识 。 它 以 
准确 的 方式 评价 那些 正常 的 头脑 通过 某 种 直 
觉 领 会 到 的 东西 ， 而 这 种 直觉 领会 经 常 不 被 


am 
ek 


皮 埃 尔 一 西蒙 . 拉 普 拉 斯 (1749—1827 ) 


学 生 问 难 











在 加 拿 大 蒙特 利 尔 综合 理工 学 校 ， 我 教 完 一 节 概率 统计 课 后 ， 有 个 来 “钓鱼 ” 
的 学 生 过 来 问 了 我 一 个 看 起 来 很 简单 的 谜 题 某 人 有 两 个 孩子 ， 其 中 至 少 有 一 个 
是 男孩 ,那么 另 一 个 孩子 也 是 男孩 的 概率 是 多 少 ? 

想 了 几 秒 之 后 ， 我 找到 了 这 个 谜 题 的 正确 答案 一 一 我 们 之 后 会 看 到 答案 不 是 
1/2。 这 位 学 生 点 点 头 ， 又 接着 问 了 第 二 个 谜 题 : 假设 你 现在 知道 这 个 人 至 少 有 一 
个 出 生 在 星期 二 的 男孩 ， 那 么 另 一 个 孩子 也 是 男孩 的 概率 是 多 少 ? 

这 次 我 答 错 了 ， 学 生 把 我 难 住 了 。 

人 们 一 般 认为 这 两 个 谜 题 只 不 过 是 数学 游戏 。 它 们 确实 有 正确 答案 , 但 这 只 
不 过 是 对 严谨 而 受 限 的 数学 框架 而 言 。 我 们 也 会 在 学 校 的 习题 或 者 考试 中 过 到 这 
种 问题 ， 但 这 只 不 过 是 数学 问题 。 


然而 ， 这 位 “钓鱼 ”学 生 的 谜 题 只 能 说 是 充斥 日 常生 活 的 众多 思考 的 超级 简 
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化 版 。 我 们 是 否 应 该 相信 某 项 医学 诊断 ?能 否 从 某 个 例子 归纳 得 出 结论 ? 如果 有 
一 千 个 甚至 一 百 万 个 例子 呢 ? 诉 诸 权 威 是 否 有 某 种 价值 ? 是 否 应 该 相信 人 金融 市 
场 ? 转基因 作物 是 否 有 害 ? 科 学 在 什么 意义 上 比 伪 科 学 更 “有 道理 ”? 机 器 人 会 
不 会 征服 世界 ? 是 否 应 该 证 责 资 本 主义 ? 是 否 应 该 相信 上 帝 的 存在 ?什么 是 好 ， 
什么 是 坏 ? 

对 很 多 人 来 说 ， 这 些 问 题 与 数学 毫 无 瓜葛 。 确 实 ， 面 对 这 种 问题 ， 数 学 自身 
无 能 为 力 。 你 不 能 只 靠 证 明定 理 来 解决 世界 上 的 饥 色 。 但 可 以 打赌 的 是 ， 数 学 可 
以 帮助 我 们 更 好 地 整理 思绪 ， 理 解 与 之 关联 的 事物 并 得 到 出 人 意料 的 答案 。 许 多 
学 科 越 来 越 数学 化 ， 其 中 包括 人 道 主义 援助 中 ,这 大 概 并 不 是 什么 偶然 。 

尽管 已 有 的 数学 模型 比比 丝 是 ， 但 我 们 之 中 大 部 分 人 似乎 坚持 希望 将 “现实 
世界 ”和 学 校 逼 着 我 们 学 习 的 知识 区 分 开 来 。 特 别 是 ， 人 们 经 常 认为 现实 世界 远 
远 超 出 了 数学 的 范畴 ， 而 数学 定理 似乎 从 来 不 应 该 甚至 不 能 应 用 到 现实 世界 中 。 
一 个 人 要 有 多 思春 才 会 认为 数学 跟 “ 法 律 面 前 人 人 平等 ”有 关系 握 ?” 而 且 , 这 种 
对 数学 应 用 的 怀疑 不 仅仅 是 差 学 生 的 条 件 反 射 。 在 面 对 “ 钩 鱼 ”学 生 失 利之 后 的 
几 年 内 ， 我 自己 也 没有 意识 到 ， 这 个 数学 上 的 失误 揭示 出 我 正确 思考 现实 世界 的 
能 力 有 缺陷 。 即 使 是 我 自己 也 没有 认识 到 ， 更 好 地 理解 这 个 谜 题 能 让 我 更 好 地 倾 
听 那 些 爱好 旅游 的 朋友 的 建议 ， 以 便 更 好 地 选择 下 一 次 假期 的 目的 地 一 一 我 们 之 


后 再 谈 这 个 问题 。 



































































































































走 上 贝 叶 斯 主义 的 道路 


当然 ， 当 天 晚上 我 就 解决 了 那 位 “钓鱼 ”学 生 的 迹 题 一 一 代价 是 一 堆 神 秘 难 
懂 的 计算 。 但 仅仅 在 三 年 之 后 的 2016 年 初 ， 当 我 开始 密切 关注 频率 主义 和 贝 叶 斯 
主义 统计 学 家 之 间 的 论战 时 外 ,我 才 真 正 开始 深思 那 位 “钓鱼 ”学 生 的 谜 题 ， 特 
别 是 将 它 放 到 纯粹 数学 的 框架 以 外 来 思考 。 

在 接 下 来 的 两 年 中 ， 我 开始 以 几乎 每 天 一 次 的 频率 思考 用 于 解 开 这 个 谜 题 的 
神奇 公式 。 令 我 喜出望外 的 是 ， 这 个 神秘 的 公式 向 我 一 步 步 展 示 了 它 的 秘密 。 焰 
眼 的 它 一 步 步 吸 引 着 我 ， 其 至 改变 了 我 思考 世界 、 科 学 与 知识 的 方式 。 在 几 个 月 
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内 ,我 最 终 沉浸 于 这 个 无 法 抗拒 的 公式 的 高 贵 优雅 之 中 。 这 实在 太 历 害 了 ， 我 必 
须 用 这 个 题材 写 整整 一 本 书 。 就 这 样 ， 在 2016 年 底 ， 我 投身 于 创作 你 现在 打开 的 
这 本 书 。 

至 于 我 刚才 说 到 的 无 法 抗拒 的 公式 ， 我 喜欢 把 它 夸 张 地 说 成 “智慧 方程 ”。 但 
数学 家 、 统 计 学 家 和 计算 机 科学 家 早已 认识 这 个 公式 ， 他 们 用 的 是 “ 贝 叶 斯 公式 ” 
这 个 名 字 。 

在 法 国 高 中 课程 里 ， 贝 叶 斯 公式 是 一 个 简明 扼要 的 数学 定理 ， 是 一 个 紧凑 的 
等 式 。 其 证 明 只 需要 一 行 ， 而 且 只 需要 用 到 乘法 、 除 法 和 有 关 概 率 的 概念 。 特 别 
是 ， 比 起 要 求 高 中 生 和 大 学 生 掌 握 的 许多 其 他 数学 概念 来 说 ， 这 个 公式 似乎 远 远 
更 容易 学 会 。 

然而 我 敢 说 ， 即 使 是 最 好 的 数学 家 也 未 必 理 解 这 个 贝 叶 斯 公式 一 一 甚至 有 数 
学 定理 解释 了 为 什么 我 们 无 法 掌握 这 个 公式 ! 即使 说 得 不 那么 绝对 ， 但 对 我 来 说 
上 毫 无 疑问 的 是 ， 我 仍然 不 理解 贝 叶 斯 公式 。 说 到 底 ， 假 如 我 在 教 那 门 概率 统计 课 
的 时 修真 正 理解 了 贝 叶 斯 公式 的 话 ， 那 么 当时 我 就 应 该 可 以 直接 看 出 “一 个 男孩 
生 在 星期 二 ”的 事实 与 其 同胞 的 性 别 之 间 的 联系 ， 并 能 立刻 回答 出 那 位 “钓鱼 ” 
学 生 的 问题 ， 而 不 应 该 被 他 难 住 。 

自 此 两 年 后 ,我 绞 尽 脑汁 不 再 这 样 被 人 问 倒 。 我 想 知道 、 想 理解 、 想 感受 贝 
叶 斯 公式 。 我 已 经 学 到 了 不 少 东 西 ， 但 我 还 在 继续 学 习 。 我 几乎 每 天 都 在 沉思 贝 
叶 斯 公式 ， 它 就 像 一 位 神 只 ， 我 每 天 都 必须 花 一 部 分 时 间 向 它 “祈祷 ”。 这 种 沉思 
佛 来 了 何等 的 幸福 ! 这 丝毫 不 是 重复 劳动 ， 更 像 是 在 一 直 灌 溉 我 的 好 奇 心 ， 一 点 
一 滴 地 向 我 低语 贝 叶 斯 公式 那些 令 人 惊讶 的 推论 。 

在 数 月 的 长 久 思考 之 后 ， 我 最 终 确 信 ， 像 贝 叶 斯 公式 那么 次 选 的 想法 并 不 多 。 
今天 我 甚至 愿意 说 ,“ 理 性 ”本 质 上 可 以 归结 于 贝 叶 斯 公式 的 应 用 一 一 这 样 说 的 
话 ， 人 人 都 不 理性 ! 无 论 如 何 ， 我 们 所 说 的 贝 叶 斯 的 哲学 ， 或 贝 叶 斯 主义 ， 就 建 
基于 此 。 
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因为 我 在 这 里 还 没有 时 间 讲 述 贝 叶 
现在 只 能 讲 个 大 概 。 如 果 必 须 用 三 句 话 粗略 概括 贝 叶 
“现实 ”的 所 有 模型 、 














定义 : 贝 叶 


LS 





斯 主义 就 是 假设 “ 
虚构 或 诗歌 ， 尤 其 要 指出 的 


思维 与 人 工 智能 





E 
JE, 





迫使 我 们 调整 赋予 不 
方式 应 





应 该 尽 可 能 严谨 地 遵 











BER UL n 




















斯 公式 是 什么 ， 





“所 有 模型 都 是 错 的 ” 
司 模型 的 重要 性 ， 


斯 公式 。 











斯 











所 以 ， 关 于 贝 叶 
主义 的 话 ， 我 会 给 
理论 或 概念 都 只 不 过 是 某 种 信 
; 然后 ， 实 际 数据 
即 置信 和 度 ; 关键 在 于 ， 











斯 主义 我 
出 以 下 








应 该 


调整 这 些 置 信和 度 的 


我 之 前 一 直觉 得 这 种 知识 哲学 没有 意义 。 它 似乎 否定 了 所 有 关于 现实 和 真理 





的 概念 ， 即 使 这 些 概念 对 研究 人 员 来 说 如 此 重要 ; 
诺 贝 尔 物理 学 奖 获 得 者 理 查 德 * 费 曼 的 说 法 外 
能 错误 的 答 

有 些 近 似 的 答案 ， 对 于 各 种 问题 也 有 些 确定 程度 或 高 或 低 的 合理 信念 ， 
绝对 确信 任何 事情 。 也 有 很 多 我 一 点 都 不 明白 的 事情 
害怕 “我 不 知道 ”这 个 事实 。 

会 觉得 这 种 观点 激动 人 心 ， 
然而 在 选择 接受 还 是 拒绝 贝 叶 


着 。 我 觉得 ， 比 起 知道 





我 
你 可 














贝 叶 斯 公式 与 它 的 推论 。 











为 了 














但 它 又 似乎 完全 符合 物理 学 家 
“我 能 带 着 疑问 、 不 而 





AX. 
定 和 无 知 活 























， 还 是 不 知道 答案 的 生活 更 有 趣 。 我 




















尝试 想象 这 位 纯粹 贝 叶 








验 的 不 是 我 ， 而 是 这 位 纯粹 贝 叶 
我 们 将 会 考虑 众多 思想 实验 ， 


们 也 会 细心 观察 、 衡 量 





FX 














只 是 纯粹 贝 叶 








斯 主义 之 前 ， 


我 只 











叫 作 “ 纯 粹 贝 叶 





斯 主义 者 ”， 


但 我 不 会 





， 但 我 不 一 定 需要 一 个 答案 。 


或 者 希望 将 这 种 看 待 知识 的 方法 拒 之 门 外 。 
能 鼓励 你 先 花 点 时 间 ， 长 考 一 下 





遗憾 的 是 ， 这 本 书 里 的 主要 向 导 ， 也 就 是 我 ， 对 这 个 公式 的 理解 还 非常 浅薄 。 
帮助 思考 ， 我 会 引入 一 位 虚构 人 物 ， 
斯 主义 者 


然后 我 们 会 


在 不 同 的 情景 下 会 做 出 什么 反应 。 我 希望 大 家 考 











斯 主义 者 ， 





RIR - Poe + prier 


并 批评 这 位 纯粹 贝 叶 
评 通 常 很 快 就 会 掉 转 了 予 头 ， 针 对 我 们 自身 的 直觉 和 难以 











斯 称 和 





斯 主义 者 的 不 完全 写照 ， 
考 和 预言 都 已 经 在 半 个 世纪 前 被 雷 ' 所 罗 门 诺 夫 这 位 戏 将 严谨 地 描述 了 





我 们 会 在 本 书 中 




















导 上 史上 第 一 位 贝 叶 太 


直 进 行 这 样 的 考验 。 




















也 就 是 这 位 纯粹 贝 叶 斯 主义 者 应 当 完 成 的 挑战 。 我 
斯 主义 者 的 各 种 反应 





这 些 批 





异 弃 的 自信 过 度 。 














斯 主义 者 ， 即 便 是 他 ， 





纯粹 贝 叶 斯 主义 者 能 做 的 所 有 计算 、 思 


出 来 。 可 
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惜 的 是 ， 所 风门 诺 夫 描述 的 这 位 纯粹 贝 叶 斯 主义 者 似乎 必然 会 违背 物理 法 则 ， 特 
别 是 之 后 会 提 到 的 图 灵 - 丘 奇 论题 ， 我 们 之 后 会 更 深入 地 讨论 这 一 点 。 

正 是 这 种 限制 迫使 我 们 只 能 考虑 一 种 必定 仅 作为 近似 的 贝 叶 斯 主义 ， 我 称 之 
为 实用 贝 叶 斯 主义 。 它 跟 纯 粹 贝 叶 斯 主义 的 不 同 之 处 ， 就 是 它 要 求 〈 迅 速 的 ) 可 
计算 性 。 我 用 另 一 位 虚构 人 物 来 代表 它 ， 我 把 这 个 人 物 叫 作 “实用 贝 叶 斯 主义 
JP. IS (或 者 说 凑巧 ) 的 是 ， 我 对 实用 贝 叶 斯 主义 者 的 描述 也 远 非 完全 ， 因 为 
实用 贝 叶 斯 主义 仍然 是 一 个 广阔 并 大 有 可 为 的 研究 领域 一 一 没 人 敢 说 这 个 领域 有 
朝 一 日 能 被 完全 解 明 。 

可 能 你 也 猜 到 了 ， 理 解 纯粹 贝 叶 斯 主义 者 与 实用 贝 叶 斯 主义 者 并 不 容易 。 为 
此 ， 我们 必须 考虑 大 量 的 基础 概念 ， 它 们 来 自 数学 、 逻 辑 学 、 统 计 学 、 计 算 机 科 
学 、 人 工 智能 ， 甚 至 还 有 物理 学 、 生 物 学 、 神 经 科学 、 心 理学 和 经 济 学 。 我 们 需 
要 谈 到 对 数 、 首 否 命题 、p 值 、 所 罗 门 诺 夫 复 杂 度 和 神经 网 络 ， 还 有 焙 、 达 尔 文 式 
演化 、 虚 假 回 忆 、 认 知 偏差 和 金融 泡沫 。 另 外 ， 我 们 也 会 用 到 科学 史 中 的 大 量 例 
子 来 考验 我 们 这 两 位 虚构 人 物 。 

对 ， 我 知道 为 了 理解 贝 叶 斯 公式 ， 要 明白 的 东西 可 不 少 …… 

但 这 岂 不 是 正好 ， 因 为 我 喜欢 在 闲暇 时 解释 现代 科学 ， 我 甚至 为 此 开通 了 名 
为 Science4All 的 YouTube 频道 ! 所 以 ， 与 其 把 这 本 书 当 成 哲学 书 来 读 ， 我 请 大 家 
不 如 把 它 当 成 科学 和 数学 的 科普 书 。 另 外 ,在 解释 贝 叶 斯 主义 的 途中 ， 我 也 不 展 
绕 几 个 弯 ， 拐 到 科学 的 漫谈 上 ， 暗 地 里 就 是 为 了 鼓励 你 在 了 解 科 学 理论 的 道路 上 
走 得 更 远 ! 

但 现在 还 是 回 到 哲学 上 吧 。 你 也 看 到 了 ， 我 最 后 还 是 届 从 于 贝 叶 斯 的 迷人 歌 
声 。 在 长 达 数 月 的 思考 之 后 ， 出 乎 意料 的 是 ， 贝 叶 斯 主义 是 如 此 吸引 着 我 ， 让 我 
觉得 必须 向 你 讲述 它 的 内 容 。 我 不 禁 觉 得 纯粹 贝 叶 斯 主义 者 实在 太 有 智 医 了 ,， 希 
能 越 来 越 向 她 靠近 …… 即 使 在 开始 写 这 本 书 之 后 ， 我 仍然 一 遍 又 一 遍地 从 这 个 
题 中 发 现 了 不 可 胜 数 的 惊人 奇 景 ， 它 已 经 变 成 我 最 喜欢 的 数学 等 式 了 。 

刚 开 始 写 这 本 书 的 时 候 ， 我 是 一 个 狂热 的 贝 叶 斯 主义 者 。 此 后 ， 我 完全 确信 和 贝 叶 
斯 主义 ， 特 别 是 跟 其 他 自称 贝 叶 斯 主义 者 的 人 相 比 ， 我 甚至 可 以 说 是 极端 贝 叶 斯 
主义 者 。 但 我 尤其 希望 有 朝 一 日 能 成 为 一 名 合格 的 贝 叶 斯 主义 者 。 我 的 梦想 就 是 
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智能 





能 够 正确 应 用 贝 叶 斯 公式 ， 因 为 我 确信 ， 只 有 这 样 ， 我 才能 成 为 一 个 理性 的 人 ! 
有 趣 的 是 ， 尽 管 看 似 了 矛盾， 但 贝 叶 斯 公式 在 我 心中 激 起 的 情感 冲动 似乎 是 一 

种 非 理 性 的 狂热 。 我 无 法 否认 这 一 点 。 我 甚至 表 定 自己 受制 于 巨大 的 认 知 偏差 ， 

使 我 在 心中 神化 了 贝 叶 斯 公式 。 毕 竟 ， 我 无 法 对 自己 发 现 了 这 个 公式 的 众多 秘密 




















的 事实 置之不理 











过 她 。 
然而 徒劳 无 功 。 


科学 方法 的 替代 





















































尽管 其 他 人 比 我 早 半 个 世纪 得 到 了 同样 的 发 现 。 
尽管 如 此 ， 我 向 你 保证 ， 在 意识 到 这 个 偏差 之 后 ,我 曾 尝试 否定 纯粹 贝 叶 斯 
主义 者 ， 而 这 项 尝试 仍 在 进行 中 。 我 不 停 地 尝试 寻找 她 的 缺陷 ， 尝 试 在 辩论 





























胜 


在 数学 中 ， 只 要 某 个 猜想 似乎 没有 问题 ， 我 们 就 会 赶紧 尝试 证 明 它 ， 好 将 它 


氛 升 到 定理 的 行列 。 贝 叶 其 
我 们 将 会 看 到 ， 杰 恩 
到 能 以 前 后 一 致 的 方式 处 理 可 能 怕 























Er - 75 vu 


i 主义 跟 这 个 差不多 ! 




















斯 定理 证 明了 ， 要 将 亚 里 士 多 德 式 的 逻辑 扩展 
这 个 概念 ， 唯 一 的 推广 方式 正 是 贝 叶 斯 主义 ; 所 



































罗 门 诺 夫 的 完备 性 定理 则 证 明了 ， 如 果 数 据 集中 存在 某 些 规律 的 话 ， 那 么 纯粹 由 









































叶 斯 主义 者 最 终 会 辨认 出 所 有 这 些 规律 ;额外 信息 期 望 收益 定理 则 证 明了 ， 纯 粹 
贝 叶 斯 主义 者 收 集 更 多 数据 总 不 会 有 坏处 。 最 后 ， 统 计 决 策 论 表 明 ， 贝 叶 斯 推断 
基本 上 就 是 唯一 可 接受 的 统计 学 习 方 法 ， 意 思 就 是 ， 对 于 某 种 统计 学 习 方法 来 说 ， 



































当 且 仅 当 它 相 当 于 贝 叶 斯 公式 的 某 种 应 用 时 ， 才 不 会 被 另 一 种 方法 全 面 领先 "。 
除了 这 些 定理 以 外 ， 还 有 很 多 其 他 定理 ， 可 惜 我 们 在 这 本 书 里 不 会 谈 到 。 比 

如 说 特 勒 -斯 克 姆 斯 中 定理 ， 它 证 明了 只 有 贝 叶 斯 主义 者 才能 在 所 请 的 “ 答 兰 

Wü" 中 中立 于 不 败 之 地 。 更 妙 的 是 ， 乔 伊 斯 的 定理 外 证 明了 ， 将 我 们 的 信念 与 概率 


























美 诠释 了 这 些 不 同 的 结果 。 


















































定理 保持 一 致 就 一 定 会 得 益 ， 这 也 是 贝 叶 斯 主义 要 求 我 们 做 的 。 双 信封 悖 论争 也 
完 





由” 这些 理 论 将 分 别 在 第 3 章 、 第 7 章 、 第 9 章 和 第 12 章 中 谈 到 。 
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我 在 这 里 只 能 粗略 地 叙述 这 些 定理 ， 因 为 它们 对 应 的 定义 与 假设 用 一 句 话说 
不 清楚 。 问 题 就 在 这 里 。 所 有 和 希望 否认 贝 叶 斯 主义 的 纯粹 主义 者 都 懂得 去 挑剔 这 














些 定 理 的 假设 。 所 以 ， 我 不 会 说 这 些 定 理 能 证 明 贝 叶 斯 主义 的 必要 性 。 
更 普遍 地 说 ， 实 际 上 我 们 似乎 不 可 能 “理性 地 ”说 服 自己 ， 贝 叶 斯 主义 是 正 





























确 的 知识 哲学 、 关 于 理论 模型 的 正确 理论 或 理性 的 正确 定义 。 毕 竞 ， 要 确信 某 个 























可 











概念 是 正确 的 ， 需 要 事先 有 一 套 能 衡量 概念 正和 
































性 的 知识 哲学 ; 要 用 理论 化 的 方 








式 思 考 各 种 理论 模型 ， 需 要 有 一 套 理论 来 判断 和 区 分 关于 理论 模型 的 不 同 理论 ; 
要 以 理性 的 方式 谈论 理性 ， 就 要 先 用 理性 的 方式 定义 理性 …… 这 就 像 一 条 咬 着 自 
































己 尾 巴 的 蛇 。 
这 个 难点 当然 并 非 贝 叶 斯 公式 所 独 有 ， 所 有 知识 哲学 似乎 都 必然 受制 于 这 种 








不 成 功 。( 哥 德 尔 ， 谢 谢 你 ! ) 











自我 指 涉 。 数 学 家 也 曾 花 上 数 个 世纪 的 努力 来 发 展 没有 自我 指 涉 的 理论 ， 然 而 并 











所 以 ， 波 普尔 的 哲学 ， 也 就 是 某 些 人 心中 科学 方法 的 正确 描述 ， 它 的 追随 者 
希望 将 知识 建 基 在 认识 的 可 证 伪 性 之 上 。 然 而 ， 即 使 是 这 个 可 证 伪 性 原则 ， 似 乎 





也 不 是 可 证 伪 的 。 所 以 ， 波 普尔 的 哲学 似乎 跟 自 























身 完全 矛盾 ,或 者 至 少 可 以 说 ， 


波 普 尔 的 哲学 根据 波 普 尔 的 标准 似乎 是 无 法 接受 的 。 这 就 是 为 什么 许多 人 会 在 科 
学 和 哲学 之 间 画 出 一 条 清晰 的 界线 ， 在 科学 和 神学 之 间 也 是 如 此 。 然 而 如 果 细 细 
考虑 的 话 ， 这 种 划 界 只 是 波 普尔 哲学 中 的 一 种 纯粹 (也许 又 麻烦 ) 的 假象 而 已 。 

















在 这 方面 ， 纯 粹 贝 叶 斯 主义 者 的 辩 白 就 有 力 得 多 。 实 际 上 ， 即 使 不 能 在 自身 





























思考 的 框架 以 外 证 明 思想 的 正确 性 ， 纯 粹 贝 叶 斯 主义 者 (我们 会 看 到 ， 对 她 来 说 ， 
切 都 是 信念 ) 似乎 仍然 能 够 不 自 相 矛盾 地 谈论 贝 叶 斯 主义 。 更 棒 的 是 ， 在 进行 
纯粹 贝 叶 斯 主义 者 的 思想 实验 之 后 ， 我 可 以 由 此 在 我 对 贝 叶 斯 主义 的 置信 和 度 上 应 







































































用 贝 叶 斯 公式 。 我 的 粗略 计算 只 增加 了 我 对 贝 叶 其 








但 还 有 两 个 更 令 人 信服 的 额外 理由 ， 使 我 在 各 种 知识 哲学 中 选择 了 贝 叶 斯 主 
































[哲学 的 置信 和 度 。 





























义 。 第 一 个 理由 就 是 贝 叶 斯 主义 的 普遍 性 。 贝 叶 斯 主义 对 应 用 范围 没有 任何 限制 ， 








bé 


与 波 普 尔 哲 学 不 同 。 波 普尔 哲学 将 自身 限制 于 知识 范畴 ， 比 如 主张 科学 实验 的 
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可 重复 性 ”和 理论 的 可 证 伪 性 。 任 何 现象 ,无 论 来 自 社会 学 、 历 史 还 是 神学 ， 都 可 
以 通过 贝 叶 斯 主义 的 视角 来 分 析 。 贝 叶 斯 主义 是 通用 的 知识 哲学 。 

第 二 个 理由 就 是 贝 叶 斯 主义 的 严谨 、 简 洁 与 清晰 。 它 定义 了 如 此 清晰 的 推理 
规则 “， 应 用 这 些 规则 似乎 足以 相对 精确 地 ( 即使 只 是 近似 地 ) 理解 这 个 世界 。 这 
正 是 计算 机 科学 家 的 理想 ， 只 要 按 下 启动 按钮 ， 机 器 就 能 执行 一 系列 指令 来 自动 
达到 目标 。 这 说 的 当然 就 是 人 工 智能 ! 30 年 以 来 ， 贝 叶 斯 公式 一 直 处 于 这 个 领域 
中 众多 研究 的 核心 ， 这 大 概 并 非 偶然 。 

近来 ， 在 乔 希 . 特 南 鲍 姆 、 卡 尔 ' 弗 里 斯 顿 和 斯 坦 尼 斯 拉 斯 : 德 阿 纳 等 研究 
者 的 推动 下 ， 在 理解 人 类 自身 的 智能 如 何 运 作 时 ， 贝 叶 斯 主义 甚至 似乎 成 了 一 个 
无 法 避免 的 理论 框架 。 特 别 是 2012 年 ， 德 阿 纳 在 法 兰 西 学 院 开设 了 一 门 认 知 科学 
的 课程 ， 名 为 “做 统计 的 大 脑 : 认 知 科学 中 的 贝 叶 斯 革命 ”( Le cerveau statisticien: la 
révolution bayésienne en sciences cognitives )。“ 许 多 生物 学 家 怀疑 神经 科学 中 可 能 
存在 某 种 一 般 性 理论 这 个 想法 ,” 德 阿 纳 在 报告 中 如 此 说 道 ，“( 然而 ) 我 们 似乎 碰 
到 了 这 样 的 理论 框架 ， 其 应 用 极其 广阔 。” 他 还 说 :“ 即 使 是 大 脑 皮层 的 结构 中 非常 
普遍 的 结构 ， 都 可 以 追溯 到 这 个 假说 ,( 也 就 是 ) 大 脑 如 此 构成 ， 目 的 就 是 进行 由 
叶 斯 式 的 统计 推 新 。 

(实用 ) 贝 叶 斯 主义 似乎 就 是 自然 母亲 为 了 使 (差不多 ) 有 智能 的 生命 得 以 出 
现 而 找到 的 答案 uo... 













































































































































































客观 性 的 迷梦 


但 神秘 的 是 ， 贝 叶 斯 主义 长 期 以 来 被 许多 代 顶 级 科学 家 所 否定。 为 什么 呢 ? 
这 些 大 科学 家 是 不 是 并 不 理性 ? 他 们 出 于 什么 动机 和 否认 贝 叶 斯 主义 ? 如 果 这 种 否 
认 没 有 依据 ， 那 么 这 些 大 科学 家 做 出 的 又 是 什么 样 的 错误 推理 ? 
说 起 来 ， 本 书 尝 试 终结 的 这 场 两 个 世纪 以 来 关于 认识 论 的 “游击 战 *"， 可 以 被 
简单 归结 为 一 场 在 “客观 性 ”这 个 概念 上 的 冲突 。 我 们 其 至 可 以 将 主观 的 贝 叶 斯 






































CD 我 们 可 以 将 这 种 对 于 可 重复 性 的 要 求 看 成 频率 主义 规定 的 必需 事项 。 
D 我 们 很 快 就 会 看 到 这 是 什么 意思 。 





limi 
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主义 者 和 客观 的 频率 主义 者 的 对 立 归结 为 这 个 问题 : 概率 是 什么 ? 

对 我 个 人 来 说 ， 这 个 问题 产生 的 影响 尤其 深刻 。 在 巴黎 高 等 师范 学 院 人 学 竞 
考 的 TIPE 口试 了 中， 我 就 被 问 到 了 这 个 问题 。 这 个 口试 本 应 是 对 一 整 年 所 进行 的 
研究 项 目的 报告 。 我 特别 自傲 于 我 的 研究 项 目 ， 那 是 对 足球 比赛 的 建 模 ， 我 估算 
了 不 同 球 队 的 水 平 并 模拟 了 多 场 比 赛 。 我 利用 此 前 两 年 的 比赛 结果 得 出 的 模拟 结 
果 是 ，2006 年 世界 杯 的 前 三 大 热门 球 队 是 葡萄 牙 队 、 法 国 队 和 意大利 队 ， 他 们 奔 
冠 的 概率 分 别 是 20% 15% 和 10%。 这 结果 不 错 ， 因 为 最 后 这 三 支 球 队 在 比赛 中 
最 后 的 排名 分 别 是 第 四 、 第 二 和 第 一 ! 

巴黎 中 央 理 工学 院 组 和 巴黎 高 等 矿业 学 院 组 ”的 考官 非常 欣赏 这 个 项 目 。 我 获 
得 了 不 错 的 分 数 ”:19/20*。 然 而 , 巴黎 高 等 师范 学 院 组 的 考官 对 比赛 模拟 并 不 感 兴 
趣 。 他 们 很 快 就 打 断 了 我 ， 只 想 知道 我 知 不 知道 概率 怎么 定义 。 

我 的 回答 是 频率 主义 式 的 。 我 断言 ， 某 个 事件 的 概率 就 是 在 重复 无 数 次 实验 
时 ， 这 个 事件 发 生 的 频率 的 极限 。 特 别 是 ， 所 有 经 验 上 的 频率 都 似乎 只 是 某 个 基 
本 而 客观 的 概率 的 近似 。 不 管 这 组 考官 是 不 是 数学 上 的 纯粹 主义 者 ， 反 正 他 们 都 
不 太 满意 。 实 际 上 ， 他 们 期 待 我 给 出 概率 的 数学 定义 ， 比 如 说 概率 就 是 某 个 单位 
测度 上 定义 的 ec 代数 上 的 某 种 测度 。 我 这 场 口试 的 得 分 只 有 6/20。 

还 是 忘 了 我 的 遭遇 吧 ， 纯 粹 贝 叶 斯 主义 者 会 说 ， 这 是 由 于 年 轻 而 犯 下 的 错误 ， 
我 们 之 后 会 再 谈 到 。 







































































(D TPE 的 全 称 是 “Travail d'initiative personnelle encadr6"， 意 为 “适度 发 挥 个 人 创造 力 ”， 与 中 
国 的 “研究 性 学 习 ” 相 似 ， 是 法 国 工 程 师 学 校 竞 考 中 的 一 门 科 目 。 每 个 学 年 初 ， 管 理 竞 考 的 
部 门 会 公布 当年 的 主题 ， 学 生 在 当年 内 必须 自行 提出 与 主题 相关 的 研究 题目 ， 并 在 教师 的 指 
导 下 ， 通 过 检索 已 有 成 果 、 自 行 研 究 与 实验 的 方式 ， 在 进行 自主 研究 的 过 程 中 学 习 研 究 。 最 
后 ， 学 生 需 要 将 研究 过 程 与 结果 写成 报告 提交 ， 并 在 口试 时 进行 答辩 。 译 者 注 

D ”法国 工程 师 学 校 的 竞 考 分 为 数 个 独立 的 组 ， 也 叫 “ 学 校 库 ”( banque )， 同 一 个 组 每 年 只 会 
行 一 次 竞 考 ， 竞 考 的 结果 受 组 内 所 有 学 校 承 认 。 目 前 的 竞 考 组 包括 巴黎 综合 理工 学 院 组 、 
黎 高 等 师范 学 院 组 、 巴 黎 中 央 理 工学 院 组 和 巴黎 高 等 矿业 学 院 组 ， 等 等 。 不 同 的 组 之 间 也 
合并 某 些 考试 。 一 一 译 者 注 

© 这 实际 上 是 我 在 TIPE-ADS 项 目 上 的 总 分 。( ADS HAPKE “analyse de documents scientifiques”, 
意 为 “科技 文献 分 析 ”， 形式 与 TIPE 相仿 。 考 生 进 入 考场 后 ， 有 约 两 小 时 的 准备 时 间 丰 
篇 约 20 页 的 科学 文献 ， 之 后 向 考官 总 结 文献 内 容 并 进行 答辩 译 者 注 ) 

@ 法 国 的 打分 制 以 20 分 为 满分 ，19/20 即 在 20 分 的 满分 中 取得 了 19 分 。 一 一 译 者 注 
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我 从 小 到 大 都 是 频率 主义 者 。 我 一 直 沉 浸 于 寻求 真理 ， 无 论 是 数学 真理 还 是 
科学 真理 。 我 接受 了 客观 结果 的 存在 与 优越 性 。 就 算 在 2013 年 我 被 “钓鱼 ”学 生 
问 倒 的 时 候 ， 我 教 的 那 门 课 绝 大 部 分 也 是 频率 主义 的 。 而 我 当时 觉得 ， 这 就 是 应 
该 教 给 学 生 的 正确 的 统计 学 ! 另外 ,我 的 足球 比赛 模型 也 是 典型 的 频率 主义 ， 正 
如 我 们 之 后 会 讲 到 的 施 泰 因 悖 论 那样 ， 如 果 这 个 模型 能 再 加 上 一 点 贝 叶 斯 主义 ， 
本 应 更 准确 。 

更 惊人 的 是 ， 即 使 是 我 算出 来 的 概率 ， 在 本 质 上 也 不 符合 频率 主义 ! 法 国 赢 
得 2006 年 世界 杯 的 频率 并 不 是 15%， 而 是 0。 的 确 ，2006 年 世界 杯 只 有 一 次 ， 而 
且 法 国 输 了 。 

但 如 果 说 模型 预测 出 的 15% 显然 不 是 频率 ， 那 么 这 个 数值 应 该 怎么 解释 ? 我 
们 还 能 不 能 说 它 是 个 概率 ? 

纯粹 贝 叶 斯 主义 者 的 回答 是 肯定 的 。 这 个 数字 就 是 根据 我 的 数学 模型 得 到 
的 法 国 赢得 世界 杯 的 概率 。 换 句 话 说， 这 个 概率 是 主观 的 ， 它 是 模型 的 意见 。 
然而 所 有 概率 都 是 如 此 。 对 纯粹 贝 叶 斯 主义 者 来 说 ， 任 何 概率 或 者 认识 都 不 是 
客观 的 ， 而 任何 否定 这 一 点 的 人 ， 都 在 将 自己 的 主观 愿望 作为 一 种 现实 强加 于 
别人 。 

的 确 ， 如 果 认 真 思 考 的 话 ， 我 们 就 会 发 现 所 有 寻求 和 整理 知识 的 方法 似乎 
都 必然 有 某 种 偏见 ， 偏 见 就 在 于 选择 了 这 个 方法 ， 而 不 是 其 他 方法 一 一 当 我 们 
援引 不 精确 的 奥 卡 姆 剃 万 、“ 已 然 确立 ”的 科学 知识 或 者 本 身 就 有 问题 的 疡 值 的 时 
候 更 是 如 此 。 更 精 糕 的 是 ， 我 们 审视 、 处 理 和 选择 数据 的 方式 ， 不 可 避免 会 影 
数据 分 析 得 出 的 结论 。 我 们 将 会 花 一 点 篇 幅 来 讨论 事实 有 时 候 是 如 何 严重 误 
导 我 们 的 Us 

此 外 ， 即 使 指明 用 到 了 什么 方法 也 不 够 。 利 用 机 器 学 习 在 大 数据 中 推断 出 有 
用 信息 的 数据 科学 家 很 早 就 发 现 了 ,没有 人 工 干扰 不 一 定 能 保证 客观 性 。 无 论 是 
人 还 是 机 器 ， 我 们 似乎 都 必定 要 在 某 个 模型 内 部 进行 推理 。 所 以 说 ， 我 们 的 结论 
似乎 必然 依赖 于 模型 。 纯 粹 贝 叶 斯 主义 者 断定 ， 这 就 说 明了 所 有 知识 都 必然 是 主 
观 的 。 

这 也 许 会 令 你 不 安 。 贝 叶 斯 主义 似乎 更 接近 相对 主义 。 如 果 所 有 知识 都 是 主 
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观 的， 那么 是 不 是 什么 意见 都 是 等 价 的 ? 答案 当然 是 否定 的 。 即 使 我 们 每 个 人 都 
看 到 了 属于 自己 的 红色 ， 这 也 并 不 说 明 ， 对 于 “法 国 国旗 上 有 没有 红色 ”这 个 问 


题 来 说 ， 


À 





























其 要 指出 的 是 ， 


的 置信 度 最 终 会 落 在 同一 组 模型 上 ， 特 别 是 在 数 
斯 主义 者 来 说 ， 就 算 在 数据 量 相对 小 的 情况 下 ， 即 使 所 有 人 乔 
那些 赢得 了 贝 叶 斯 主义 者 置信 和 度 的 模型 也 比 其 他 没有 应 用 贝 叶 其 
的 模型 更 贴切 、 更 有 用 。 














所 有 意见 都 是 等 价 的 。 














对 于 在 同一 组 数据 上 严格 应 用 贝 叶 斯 公式 的 人 来 说 ， 他 们 


















































昌 量 大 的 情况 下 。 但 对 纯粹 贝 叶 
i 对 的 数据 都 相同 ， 
1 公式 的 人 所 青睐 


要 特别 注意 的 是 ， 贝 叶 斯 主义 ( 特别 是 实用 贝 叶 斯 主义 ) 并 不 能 代替 数学 建 
模 。 这 种 哲学 的 首要 目标 是 分 辨 出 有 用 的 模型 。 贝 叶 斯 主义 的 基础 实际 上 可 以 用 


贝 叶 斯 主义 的 “至 圣 先 师 ” 乔 治 ' 博克 
些 模型 很 有 用 。” 我 经 常 复述 这 人 句 话 ! 不 管 这 句 引 语 是 否 “ 正 胡 
非常 有 用 ， 可 以 帮 我 跳 过 那些 一 姑 

































































斯 的 一 句 话 概括 :“ 所 有 模型 都 是 错 的 ， 有 
”， 但 它 对 我 来 说 






































F 始 就 注定 走 进 死胡同 、 没 完 没 了 、 能 把 人 烦 死 





的 辩论 。 就 像 那 些 贝 叶 斯 主义 前 右 那 样 ， 我 最 后 发 现 判 定 模 型 的 用 人 处 更 有 趣 ， 尤 


n 





然 


就 是 借 














其 是 它 对 预言 能 力 的 判定 ， 其 真实 性 则 无 所 谓 。 














而 纯粹 贝 叶 斯 














助 员 叶 斯 公式 。 





本 书 的 目标 








FE 义 者 会 说 ， 要 正确 地 衡量 不 同 模型 是 否 有 用 , n 

















即使 我 希望 分 享 并 论证 贝 叶 斯 主义 让 我 感受 到 的 热情 ， 即 使 我 暗 








一 的 方式 











RARES 


让 数学 家 、 哲 学 家 和 科学 家 质疑 各 自 领 域 中 那些 他 们 自 以 为 已 经 知道 的 东西 ， 但 
这 本 书 的 目的 不 是 让 你 接受 贝 叶 斯 主义 。 我 希望 与 读者 分 享 让 我 转向 贝 叶 斯 主义 


的 一 些 珠玉 。 我 敢 打 赌 一 一 这 也 是 典型 贝 叶 斯 式 的 反应 
惊 的 推论 ， 以 及 它 在 应 用 数学 、 我 们 自 


d ARE 















































面 对 贝 叶 











斯 公式 那些 

















存在 ,你 大 概 会 大 吃 一 惊 ,其 至 会 有 点 被 它 吸引 ， 这 正 是 我 希望 的 。 
贝 叶 斯 主义 解释 了 为 什么 科学 共同 体 比 其 中 每 一 个 成 员 更 可 靠 ， 也 解释 了 为 
什么 我 们 大 脑 里 的 小 傻瓜 们 一 直 会 受到 锚 定 效应 的 影响 。 它 还 解释 了 为 什么 将 互 









































身 思考 方式 甚至 社会 结构 中 的 普遍 
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相 不 兼容 的 模型 组 合 起 来 能 得 
的 工具 。 它 甚至 可 能 是 至 
































mp 
GG 





到 更 好 的 结果 ， 还 有 为 什 和 
LE 解 记忆 的 运转 和 梦 的 作用 的 钥匙 
布 然 斯 基 所 说 的 :“ 生 物 学 中 的 任何 东西 只 有 在 演化 之 光 下 才 有 意义 。” 


为 数 众多 的 机 制 只 能 通过 贝 叶 斯 的 视点 来 理解 。 


我 发 现 了 贝 叶 
率 的 语言 能 让 我 们 量化 不 确定 性 ， 但 我 无 法 正确 应 用 贝 叶 斯 2 
学 生 谜 题 的 那个 简单 情况 也 是 如 此 ， 这 迫使 我 重新 认识 到 自 
有 一 种 非 理 性 、 无 根据 的 自信 ， 
但 在 不 断 接近 纯粹 贝 叶 斯 主义 者 的 过 程 
斯 主义 的 经 历 迫 使 我 意识 到 自己 顽固 的 自信 过 度 ， 因 此 我 更 应 该 将 
斯 公式 上 。 这 也 是 本 书 的 主要 目标 之 一 。 我 们 努力 对 抗 自信 过 度 ， 


考 者 。 我 之 前 儿 
种 对 贝 叶 斯 公式 的 奇怪 的 不 信任 感 。 
这 段 贝 叶 


度 放 在 贝 叶 











斯 主义 ， 





笃 常 对 自己 








奥 卡 姆 剃刀 是 不 可 或 缺 


。 就 像 特 奥 多 修 


这 对 我 来 说 是 探知 自身 无 知 的 绝 佳 机 会 。 比 如 说 ， 











斯 .多 
我 也 认为 ， 





概 




















,的 直觉 















































试探 知 自己 有 多 无 知 。 
这 本 书 接 下 来 可 以 大 略 分 为 四 个 部 分 。 从 第 2 章 到 第 

















EB 
己 只 是 一 


公式 ， 就 算是 “钓鱼 ” 
个 整 脚 的 思 


有 时 还 伴随 着 一 
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7 章 ， 我 们 会 先 着 手 于 


贝 叶 斯 公式 以 及 纯粹 贝 叶 斯 主义 。 第 8 章 到 第 13 章 的 目标 是 揭示 各 种 现象 中 隐藏 
的 贝 叶 斯 原理 一 一 我 们 或 许 未 兽 意 识 到 ， 这 些 现象 中 有 着 贝 叶 斯 主义 的 一 面 。 在 






































接 下 来 的 第 14 章 到 第 19 章 中 ,我们 会 探讨 实用 贝 叶 斯 主义 及 其 不 可 或 缺 的 工具 。 








最 后 三 章 与 之 前 的 章节 
斯 主义 的 哲学 推 ; 








"m 











的 推论 


To 


可 惜 的 是 ， 这 本 书 跟 一 
往 数 的 不 足 之 处 说 声 抱 攻 ， 
的 哲学 流派 进行 深入 比较 。 我 的 目标 没 那么 远 
E 解 的 那些 方面 。 
你 原 访 我 的 无 知之 处 。 我 会 举 
多 的 对 我 来 说 重要 的 思想 ， 但 也 必定 会 遗漏 那些 我 不 知道 或 误 判 其 重要 属 


本 书 不 可 月 
他 与 之 竞争 
理解 贝 叶 
商 也 是 有 限 的 ， 所 以 请 


我 的 大 有 








切 篇 


1 关联 不 大 大 ， 
论 ， 尤 其 是 有 关 实 在 论 的 推论 ; 
起 源 ， 考 问 我 们 反复 出 现 的 自信 过 度 ; 第 22 童 探讨 的 是 贝 叶 


题 为 





“一 切 都 是 虚构 ”的 第 20 章 探 讨 的 是 贝 
第 21 章 会 追溯 我 的 那些 信念 








下 有 限 的 书 一 样 ， 难 免 挂 

















斯 主义 的 某 些 重要 方面 ， 











尤其 是 因为 我 没有 花 














斯 主义 在 道德 哲学 上 


漏 万 。 我 在 这 里 先 为 





CR 


K, 





ENERE 














时 间 将 贝 叶 











斯 主义 与 其 


只 是 希望 能 帮助 你 


的 确 ， 跟 本 书 一 样 ， 








试 提 及 和 揭示 尽 可 能 





E 的 内 容 。 


另外 ， 本 书 描述 的 是 截至 出 版 时 我 的 认 知 状态 ,但 在 掌握 贝 叶 斯 主义 的 旅程 

















进展。 如 果 你 愿意 伴随 我 踏 上 这 段 旅程 的 话 ， 请 在 
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Twitter 上 关注 我 (@science4all) ， 并 查看 我 的 视频 频道 Science4All， 我 从 2018 年 末 
开始 在 频道 中 放 了 一 系列 关于 贝 叶 斯 公式 的 视频 。 我 同样 邀请 你 前 往 我 和 哲学 家 
BR 吉 罗 ( 网 名 是 Monsieur Phi) 共同 主持 的 播客 “公理 ”( Axiome )， 倾 听 我 
们 的 思考 。 尽 管 我 们 的 目标 是 探讨 所 有 与 数学 、 哲 学 和 各 种 自然 科学 有 关 的 东西 ， 
但 鉴于 我 们 都 对 概率 和 逮 辑 无 比 着 迷 ， 我 们 也 反复 谈 到 了 贝 叶 斯 主义 的 方方面面 ， 
其 中 一 些 内 容 在 本 书 中 没有 提 及 ， 比 如 贝 特 朗 悖 论 的 贝 叶 斯 解释 Ua. 

除了 我 的 认 知 限制 以 外 ， 因 为 这 本 书 的 目标 读者 是 一 般 大 众 ， 无 须 任 何 预备 
知识 ， 所 以 我 不 会 写 出 纯粹 贝 叶 斯 主义 者 避 不 开 的 那 种 严谨 证 明 一 一 尽 可 能 让 你 
远离 那些 违反 直觉 的 内 容 ， 毕 竞 本 书 属于 科普 读物 。 

你 很 可 能 无 法 完全 理解 所 有 内 容 。 因 为 我 不 想 跳 过 那些 最 有 说 服 力 的 论据 ， 

所 以 我 冒昧 留 下 了 几 个 难度 颇 高 的 章节 ， 它 们 被 打上 了 星 号 (* )。 我 不 得 不 提醒 
你 一 点 : 即使 你 是 数学 博士 ， 你 可 能 也 只 有 在 极 认真 、 努 力 地 阅读 本 书 的 情况 下 ， 
才能 掌握 我 向 你 讲述 的 所 有 概念 。 
读 这 本 书 的 时 候 请 不 要 急躁 ， 要 多 花 点 时 间 思 考 ， 但 也 不 要 轻易 放弃 。 这 本 
书 并 不 是 越 往 后 面 越 难 ， 你 可 以 在 没有 阅读 之 前 章节 的 情况 下 享受 每 一 章 一 一 虽 
然 按 顺序 阅读 每 一 章 可 能 更 好 。 这 不 是 一 本 教材 ， 也 没有 考试 。 我 不 会 要 求 你 理 
解 所 有 内 容 ， 甚 至 强烈 建议 你 跳 过 那些 太 复 杂 的 段落 继续 阅读 ( 如 果 你 之 后 肯 回 
到 这 些 难度 较 大 的 段落 的 话 )。 我 的 目标 不 是 让 你 成 为 贝 叶 斯 主义 的 专家 。 

我 最 希望 的 是 ， 你 能 享受 贝 叶 斯 的 推理 以 及 在 理解 贝 叶 斯 主义 的 基础 和 
推论 时 用 到 的 那些 科学 内 容 ， 并 从 中 找到 美感 。 我 希望 你 能 把 自己 当 作 一 位 探险 
家 ， 出 发 去 探索 未 知 的 土地 ， 发 现 各 种 各 样 的 动物 、 植 物 、 文 化 与 引人入胜 的 风 
景 ， 而 不 一 定 要 花 时间 学 会 本 地 语言 中 的 所 有 细微 之 处 。 我 希望 你 能 从 这 段 旅程 
! 获 益 。 

如 果 你 跟随 我 的 脚步 的 话 ， 那 么 我 希望 你 也 会 沉浸 在 热忱 、 魅 力 和 疑问 之 中 ， 
这 就 是 本 书 的 首要 目的 。 
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跟 许多 我 认识 的 人 一 样 ， 我 的 思考 范式 最 大 
的 转变 之 一 就 是 学 会 了 贝 叶 斯 的 法 则 。 
KRFA e mF] K (1983 一 ) 
我 们 都 是 本 能 上 不 理性 的 策 蛋 ， 无 法 正确 修 
订 我 们 的 信念 ， 而 理解 贝 叶 斯 的 这 个 法 则 真 
的 可 以 帮助 改善 我 们 自身 。 
dem. 吉 罗 (1986 一 ) 
贝 叶 斯 统计 很 难 ， 就 像 思考 那么 难 。 
唐纳德 " 贝 里 (1940 一 ) 
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我 们 回 到 那 位 “钓鱼 ”学 生 的 谜 题 上 。 一 位 父亲 有 两 个 孩子 ， 至 少 一 个 孩子 





是 男孩 ,那么 另 一 个 孩子 也 是 男孩 的 概率 是 多 少 ?” 我 请 你 








尝试 自己 解决 这 个 问 


题 。 即 使 你 解 不 出 来 ， 这 种 智力 锻炼 对 之 后 的 阅读 也 可 能 有 帮助 。 
我 现在 向 你 展示 这 个 问题 的 解答 ， 最 简单 的 解法 就 是 列 出 所 有 可 能 的 情况 。 








我 们 将 两 个 孩子 叫 作 小 晨 和 小 迪 。 可 能 的 情况 有 四 种 : 


e. 小 晨 和 小 迪 都 是 男孩 ; 
e 小 晨 是 男孩 ， 小 迪 是 女孩 ; 
e 小 晨 是 女孩 ， 小 迪 是 男孩 ; 
e. 小 晨 和 小 迪 都 是 女孩 。 








这 四 种 情况 是 等 可 能 的 ， 也 就 是 说 ， 它 们 的 概率 都 一 样 ， 虽 然 这 也 不 太 准 
确 。 生 物 学 家 会 明确 指出 ， 事 实 上 51% 的 新 生 儿 是 男孩 一 一 这 个 结果 是 拉 普 拉 斯 
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通过 贝 叶 斯 式 的 计算 得 到 的 。 但 我 们 先 简化 一 下 ， 假 设 每 个 孩子 是 男孩 的 先 验 概 
率 是 50%。 

但 是 我 们 知道 小 晨 和 小 迪 中 至 少 有 一 个 是 男孩 ， 前 三 种 可 能 性 符合 这 个 新 信 
息 ， 第 四 种 可 能 性 不 符合 。 所 以 ,我 们 可 以 划 掉 第 四 种 可 能 性 。 

现在 ， 如 果 已 知 小 晨 和 小 迪 中 至 少 有 一 个 是 男孩 的 话 ， 那 么 另 一 个 孩子 也 是 
男孩 的 可 能 性 恰好 对 应 小 晨 和 小 迪 都 是 男孩 的 情况 。 这 就 是 一 个 孩子 是 男孩 ， 而 
另 一 个 孩子 也 是 男孩 的 唯一 可 能 性 。 换 句 话 说， 我 们 尝试 计算 的 ， 就 是 在 已 知 其 
中 至 少 一 个 孩子 是 男孩 的 情况 下 ， 两 个 孩子 都 是 男孩 的 概率 。 

这 对 应 剩 下 三 种 可 能 性 中 的 一 种 。 于 是 ， 要 计算 的 概率 就 等 于 1/3 MAÉ 
1/2 ! 惊 不 惊人 ? 

我 记得 第 一 次 详 读 这 个 证 明 的 时 候 ( 远 远 在 “钓鱼 ”学 生 向 我 提出 这 个 谤 题 
之 前 )， 我 并 没有 信服 。 这 个 论证 是 否 的 确 有 效 这 一 点 并 不 明确 。 我 们 是 不 是 真 的 
可 以 划 掉 第 四 种 可 能 性 ， 只 考虑 前 三 个 仍然 等 概率 的 可 能 性 ? 

我 可 以 帮 你 走出 这 个 困境 ， 现 在 就 给 你 指出 思考 这 个 问题 的 正确 方法 一 一 当 
然 是 应 用 贝 叶 斯 公式 ! 但 是 ， 我 觉得 现在 还 是 认真 思考 一 下 为 好 。 































































































RE- ERIA 


现在 我 们 来 考虑 蒙 蒂 ， 霍 尔 问题 。 这 个 概率 论 经 典 问题 的 灵感 来 自 20 世纪 60 
年 代 由 蒙 带 : 堆 尔 主持 的 一 个 叫 作 《达成 协议 》( Lets Make a Deal ) 的 美国 电视 游 
戏 节 目 。 在 节目 的 最 后 ， 参 赛 者 必须 在 三 道门 帘 中 选 一 道 。 其 中 一 道门 帘 之 后 有 
一 辆 汽车 ， 其 余 两 道门 帘 后 面 是 山羊 。 人 参赛 者 选择 之 后 ， 蒙 蒂 ， 霍 尔 会 增加 悬念 : 
在 参赛 者 没有 选择 的 门帘 之 中 ， 至 少 有 一 道门 帘 背 后 是 山羊 。 然 后 ， 蒙 蒂 ' 和 截 尔 
会 将 这 道 背后 是 山羊 的 门帘 打开 。 

现在 剩 下 两 道门 帘 ， 其 中 一 道 后 面 有 汽车 ， 另 一 道 后 面 则 有 山羊 。 这 时 ， 蒙 
带 . 霍 尔 就 会 向 参赛 者 提出 一 个 新 选择 : 他 可 以 维持 自己 的 选择 或 者 换 一 道门 帘 。 
这 位 参赛 者 应 该 怎么 做 ?他 应 该 遵循 一 开始 的 直觉 ， 还 是 应 该 改变 主意 ? 

跟 “ 钩 鱼 ” 学 生 的 谜 题 一样 ， 我 们 似乎 又 落 入 了 去 掉 一 种 可 能 性 的 相似 情况 
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中 。 我 们 倾向 于 认为 汽车 的 所 在 位 置 仍然 是 等 概率 的 ， 是 否 改变 主意 并 不 重要 。 
如 果 你 就 是 这 么 想 的 话 ， 要 知道 在 你 之 前 许多 顶级 数学 家 都 犯 了 跟 你 一 样 的 

错误 。 蒙 蒂 ， 霍 尔 问题 难 倒 了 很 多 聪明 绝顶 的 人 。1990 年 ， 当 玛丽 莲 : 沃 斯 D 

万 特 在 美国 《大 观 》( Parade ) 杂志 中 给 出 这 个 问题 的 正确 答案 时 ， 一 万 名 读者 给 











Aus Hd. Brei + 萨 万 特 搞 错 了 ， 其 中 一 千 名 读者 还 持 有 博士 学 位 。 

即使 是 著名 数学 家 埃 尔 德 什 : 帕 尔 ， 也 就 是 数学 史上 发 表 论 文 最 多 的 人 ， 也 不 
相信 沃 斯 ， 萨 万 特 的 严谨 证 明 。 只 有 在 看 到 模拟 结果 之 后 ， 大 为 惊讶 的 埃 尔 德 什 
才 认 输 。 大 数学 家 埃 尔 德 什 也 不 理解 贝 叶 斯 公式 ， 他 也 不 是 唯一 一 个 不 理解 的 人 。 





















































我 是 在 13 岁 的 时 候 遇 到 蒙 蒂 ' 霍 尔 问 题 的 ， 我 当时 并 不 知道 贝 叶 斯 公式 。 但 
有 一 个 论证 既 有 足够 的 说 服 力 ， 又 能 让 我 理解 。 其 实 ， 在 选择 一 道门 帘 之 后 ， 如 
果 你 知道 自己 不 会 改变 主意 ， 那 么 接 下 来 的 结果 就 像 蒙 蒂 ' 霍 尔 没 有 增加 悬念 掀 
起 有 山羊 的 门帘 那样 。 你 选 到 汽车 的 可 能 性 ， 也 就 是 一 开始 选择 的 门帘 后 面 有 汽 












































车 的 概率 ， 等 于 1/3。 所 以 如 果 你 不 改变 主意 的 话 ， 那 么 赢 的 概 























率 就 是 113。 奇怪 





的 是 ， 这 个 结果 说 服 了 我 ， 但 我 还 是 不 能 计算 改变 主意 之 后 赢 的 概率 。 
如 果 你 维持 选择 却 输 了 的 话 ， 也 就 是 说 ， 未 选择 的 门帘 背后 就 是 汽车 ， 即 莹 























蒂 ' 霍 尔 建议 你 改 主 意 选 择 的 那 道 门帘 ,那么 实际 上 发 生 的 事情 是 ， 三 次 中 有 两 














次 你 一 开始 选择 的 门帘 后 面 是 山羊 。 在 这 种 情况 下 ， 当 只 剩 下 两 道门 帘 的 时 候 ， 
汽车 必定 在 男 一 道门 帘 背 后 。 如 果 你 改变 选择 就 能 启 ， 三 次 中 启 两 次 。 

这 里 的 数学 原理 毋庸 置疑 。 你 换 一 道门 帘 就 能 使 局 得 汽车 的 可 能 性 加 倍 ! 与 
那些 没有 花心 力 慢 慢 仔 细 思 考 这 个 问题 并 保留 最 初 选择 的 人 相 比 ， 纯 粹 贝 叶 斯 主 




















义 者 说 得 汽车 的 可 能 性 是 他 们 的 2 售 。 

















如 果 你 还 没有 被 这 个 论证 说 服 ， 那 么 我 请 你 以 埃 尔 德 什 为 榜样 ， 自 己 做 个 实 
验 。 在 英国 广播 公司 (BBC ) 的 一 部 出 色 的 纪录 片 中 ， 数 学 家 马 库 斯 RE RIE 
伊 向 喜剧 演员 阿兰 . 戴 维 斯 提出 了 蒙 带 : 霍 尔 问题 。 一 脸 怀 疑 的 阿兰 ， 戴 维 斯 相 
信 ， 在 重复 进行 的 蒙 带 : 霍 尔 游戏 中 不 改变 门帘 的 选择 会 有 优势 ， 跟 绝对 会 改变 




































































的 马 库 斯 . FE - 索 托 伊 正好 相反 。 在 20 次 尝试 中 ， 阿 兰 ， 戴 维 斯 只 赢 了 2 次 ， 而 


























马 库 斯 . RE + RIT 16 次 。 当 然 ， 这 些 数字 似乎 不 符合 贝 叶 斯 理论 预言 的 
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1/3 和 2/3 一 一 这 都 是 小 数 定律 ”的 错 ! 但 好 处 就 是 这 说 服 了 阿兰 ， 戴 维 斯 自己 错 
了 ,或 者 说 他 至 少 做 到 了 这 一 点 ， 因 为 他 似乎 并 没有 明白 马 库 斯 * FE + 索 托 伊 的 
解释 。 



































一 局 过 后 ， 阿 兰 ， 戴 维 斯 只 是 丢掉 了 一 点 尊严 ， 要 是 他 知道 就 连 镜 子 对 蒙 
"o 霍 尔 游戏 的 理解 都 比 他 更 正确 的 话 外， 那 他 丢掉 的 尊严 就 可 不 止 这 一 点 点 了 。 
有 时 候 ,“ 误 解 ” 贝 叶 斯 公式 会 导致 更 严重 的 后 果 。 萨 莉 ， 克 拉克 就 为 此 在 人 生 中 
付出 了 最 惨重 的 代价 。 



































H O 克拉 克 的 审判 


1996 £E, gd - 克拉 克 的 新 生 儿 在 出 生 两 周 后 就 去 世 了 。 一 年 之 后 历史 重 
演 ， 她 生 下 的 第 二 名 婴儿 也 去 世 了 。 萨 莉 ' 克拉 克 被 控 两 宗 谋 杀 罪 。 儿 科 医 生 罗 
伊 ， 梅 多 出 庭 作 证 ， 他 宣称 两 名 新 生 儿 接连 由 于 自然 原因 死亡 的 概率 是 7300 万 分 
之 一 ， 这 段 证 词 给 萨 莉 克拉克 定 了 罪 。 

然而 在 三 年 之 后 ， 人 们 发 现 负 责 尸 检 的 医生 阿兰 ， 威廉 斯 当时 没有 报告 他 的 
分 析 结 果 : 第 二 个 新 生 儿 的 的 确 确 死 于 自然 原因 。 萨 和 莉 ' 克拉 克 最 终 被 释放 了 ， 
但 并 非 毫 无 遗 患 ， 她 的 精神 受到 了 极 大 的 创伤 ， 四 年 后 死 于 饮酒 过 量 导致 的 展 迷 。 
除了 威廉 斯 医生 的 玻 忽 以 外 ， 节 莉 克拉克 苦 难 的 原因 可 以 追溯 到 一 类 对 贝 
叶 斯 公式 的 误 用 ， 又 叫 检 察 官 雇 误 。 法 官 (你 可 ) 混淆 了 两 名 新 生 儿 由 于 自 
然 原 因 死亡 的 概率 以 及 萨 莉 ， 克 拉克 无 罪 的 概率 。 然 而 罕见 的 犯罪 证 据 不 一 定 能 
作为 犯罪 指控 。 

我 们 之 后 会 详细 讨论 检察 官 雇 误 ， 因 为 它 存 在 于 科学 方法 的 大 部 分 经 典 解释 
之 中 。 但 现在 我 们 就 应 该 强调 这 是 个 雇 误 。 犯 罪证 据 很 军 见 ， 可 能 只 是 因为 嫌疑 犯 
的 情况 特殊 而 已 。 萨 莉 ' 克拉 区 遇 到 的 情况 罕见 无 比 ， 两 名 新 生 儿 死亡 的 概率 本 刁 













































































中 ”小数 定律 是 对 大 数 定律 的 一 种 戏 仿 。 大 数 定律 说 的 是 某 个 事件 在 重复 足够 多 次 后 ， 出 现 的 频率 
会 趋向 于 事件 的 概率 。 而 小 数 定律 可 以 说 是 人 类 在 认 知 中 对 大 数 定律 的 一 种 误 用 : 即使 在 
例 数量 较 少 ， 不 符合 大 数 定律 前 提 的 情况 下 ， 人 们 也 会 认为 可 以 应 用 大 数 定律 ， 认 为 事例 足 
够 有 代表 性 ， 轻 率 地 就 此 做 出 结论 ， 而 不 考虑 例子 数目 不 足 导 致 错误 的 可 能 性 。 一 一 译 者 注 
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就 极端 地 低 。 所 以 ， 这 两 名 新 生 儿 由 于 自然 原因 死亡 的 概率 只 可 能 同样 极端 地 低 。 





事实 上 ,英国 索 尔 福 德 大 学 数学 教授 雷 : 希 尔 进 











行 的 近似 计算 证 明 ， 虽然 两 


名 新 生 儿 由 于 自然 原因 死亡 的 概率 很 低 , 但 这 也 要 比 双重 谋杀 的 概率 高 5~10 倍 。 














换 句 话说 ， 贝 叶 斯 公式 会 迫使 我 们 更 强烈 倾向 于 自然 死亡 的 假设 ， 
顺 融 一 提 ， 项 尔 同时 指出 了 儿科 医生 梅 多 的 计算 中 的 一 个 重大 错误 ， 那 就 














杀 
是 他 没有 考虑 两 名 新 生 儿 的 死亡 之 间 的 相关 性 ， 
终结 论 更 利于 自然 死亡 的 假设 。 





被 判 非法 的 贝 叶 斯 主义 








而 不 是 双重 谋 











一 相关 性 会 使 贝 叶 





斯 计算 的 最 


在 萨 莉 ' 克拉克 案件 的 审理 中 ， 英 国 司 法 铸 成 了 大 错 。 但 这 场 严 剧 并 没有 使 
人 们 认识 到 贝 叶 斯 公式 的 重要 性 ,反而 加 深 了 人 们 对 统计 的 不 信任 ,以 至 于 在 
2010 年 ， 一 位 英国 法 官 将 贝 叶 斯 定理 排除 在 法 院 审理 之 外 。 在 法 官 面前 主张 贝 叶 
























































斯 主义 变 成 了 非法 行为 ! 智慧 方程 在 法 院 中 被 禁止 了 ! 














但 我 们 也 难以 怪罪 这 位 法 官 。 就 算是 埃 尔 德 什 在 贝 叶 斯 公式 的 应 用 上 也 遇 到 
了 困难 。 要 求法 官 和 陪审 团 在 这 个 公式 的 基础 上 思考 ， 这 真 的 合理 吗 ? 

















即使 纯粹 贝 叶 斯 主义 者 可 以 自如 穿行 司法 系统 这 个 
要 让 法 庭 被 众多 无 人 能 解 或 者 易 被 误解 的 统计 数据 淹没 。 




















杂 迷 宫 ， 也 必须 注意 不 
在 发 表 于 期 刊 《 统 计 与 


应 用 年 度 评论 》( The Annual Review of Statistics and Its Applications ) 上 的 一 篇 文章 
中 ， 芬 顿 、 尼 尔 和 伯 杰 也 做 出 了 如 下 评论 :“ 有 另 一 个 之 前 少 有 陈述 但 以 后 会 变 得 
重要 的 原因 ， 它 限制 了 ( 贝 叶 斯 公式 的 ) 应 用 : 为 了 使 计算 能 够 手 算 进 行 ， 贝 叶 
论证 。” 这 几 位 作者 意识 到 了 




















斯 方法 的 大 部 分 例子 都 过 分 简化 了 它们 所 建 模 的 法 得 




















这 个 困难 ， 提 出 了 一 个 更 精细 的 贝 叶 斯 理论 ， 那 就 是 我 们 之 后 会 再 谈 到 的 贝 叶 斯 








网 络 。 现 在 必须 看 到 的 是 ， 司 法 系统 有 多 么 不 理性 ， 























应 用 贝 叶 斯 公式 的 机 事 ， 那 只 会 徒劳 无 功 。 
然而 ， 我 认为 要 是 真正 花 时 间 思 考 的 话 ， 每 个 

















而 且 修正 它 它 又 极端 困难 。 
极端 简化 的 贝 叶 斯 计算 有 着 很 大 的 局 限 性 ， 即 使 对 于 最 聪明 的 人 来 说 ， 正 确 
的 贝 叶 斯 计算 也 过 于 复杂 ， 难 以 完成 。 所 以 ， 这 本 书 的 目的 绝对 不 是 让 你 成 为 能 





人 都 能 掌握 那些 简单 的 例子 。 
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当 在 最 实际 的 情况 下 进行 近似 的 贝 叶 斯 思考 时 ， 这 些 例 子 可 以 作为 参照 或 者 练习 。 
我 不 会 强求 你 成 为 纯粹 贝 叶 斯 主义 者 ， 但 我 希望 你 成 为 成 熟 的 思考 者 ， 和 希望 能 帮 
助 你 (掌握 如 何 ) 将 直觉 贝 叶 斯 化 。 

我 同样 希望 成 功 向 你 展示 直觉 在 概率 计算 上 何等 不 堪 大 用 。 然 而 ， 对 于 纯 贝 
叶 斯 主义 者 来 说 ， 理 性 就 是 遵循 概率 法 则 。 当 我 们 深思 那些 面 对 贝 叶 斯 公式 产生 
的 疑问 ， 希 望 说 服 自 己 这 个 公式 就 是 一 切 认 识 论 困境 的 解决 办 法 时 ， 我 们 当然 会 
怀疑 自身 的 所 有 信念 。 我 认为 ， 这 就 是 发 现 自己 的 思考 方式 多 么 糟糕 时 的 正常 反 
应 。 我 们 要 接受 自己 总 是 自以为是 的 这 一 事实 ， 还 必须 减少 对 非 贝 叶 斯 的 直觉 和 
推理 的 置信 度 。 
































































































































贝 叶 斯 定理 


闲话 休 提 ， 现 在 是 时 候 给 你 看 看 我 最 喜欢 的 数学 公式 了 。 下 面 我 将 要 介绍 的 
就 是 贝 叶 斯 公式 。 为 此 ， 我 要 引入 来 自 医学 领域 的 第 四 个 例子 。 
想象 一 下 ， 化 验 结果 显 示 你 感染 了 埃 博 拉 病 毒 ， 而 你 知道 自己 刚 从 尼日利亚 
度假 归来 。 你 自然 会 询问 化 验 的 可 靠 程度 。 别 人 告诉 你 ， 健 康 的 人 得 到 正确 的 化 
验 结果 的 概率 是 90%。 你 是 不 是 应 该 开始 写 遗 嘱 了 ? 

纯粹 贝 叶 斯 主义 者 的 回答 只 有 一 个 : 不 急 。 即 使 在 受 这 种 病毒 影响 最 大 的 撤 
哈 拉 以 南 的 非洲 ， 感 染 埃 博 拉 病毒 的 人 也 万 中 无 一 。 所 以 你 这 个 只 在 尼日利亚 短 
暂停 留 过 的 人 ， 感 染 这 个 病毒 的 可 能 性 显然 不 足 万 分 之 一 。 我 们 可 以 将 这 个 概率 
简单 记 为 PI@]， 它 也 叫 作 先 验 概率 。 

现在 假设 你 得 知 化 验 结果 为 阳性 ， 之 后 需要 考虑 的 就 是 已 知 化 验 结果 为 阳性 
时 感染 埃 博 拉 病 毒 的 概率 ， 我 们 将 它 记 为 Pre, HE RL 
为 阳性 。 反 之 ， 我 们 用 符号 6 来 表示 化 验 结果 为 阴性 。 

所 谓 的 条 件 概率 PEN] 是 什么 意思 呢 ? 概率 论 的 基本 公设 假定 这 个 条 件 概率 
与 事件 @ 和 多 的 概率 有 如 下 联系 : 
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换 句 话说， 在 已 知 化 验 结果 为 阳性 的 情况 下 感染 病毒 的 概率 ， 就 是 化 验 结果 为 阳 
性 并 且 感 染病 毒 的 人 在 所 有 化 验 结果 为 阳性 的 人 群 中 所 占 的 比例 。 

值得 指出 的 是 ， 在 今天 ， 即 使 是 最 反对 贝 叶 斯 主义 的 统计 学 家 也 接受 这 个 公 
设 。 实 际 上 ， 我 们 可 以 把 它 当成 条 件 概 率 的 定义 。 跟 所 有 定义 一 样 ， 它 不 可 能 出 
错 。 然 而 ， 人 们 可 能 会 怀疑 这 是 不 是 条 件 概 率 的 一 个 贴切 (而 有 用 ) 的 定义 ， 特 
别 是 人 们 还 会 考虑 它 是 否 跟 自然 语言 一 致 ， 以 及 应 该 怎么 用 它 来 思考 。 纯 粹 贝 叶 
斯 主义 者 的 信念 就 是 ， 这 个 定义 不 仅 接近 自然 语言 中 的 说 法 ， 而 且 正 是 这 个 概念 
的 正确 思考 方式 。 贝 叶 斯 主义 ， 就 是 将 条 件 概 率 的 语言 作为 所 有 知识 的 基础 。 

跟随 纯粹 贝 叶 斯 主义 者 的 脚步 ， 我 们 承认 条 件 概率 pP[eS| 9] 的 确 描 述 了 在 已 知 
化 验 结果 为 阳性 的 情况 下 感染 病毒 的 概率 。 然 而 ， 你 获知 的 数值 并 不 是 这 个 概率 。 
你 听 到 的 90% 这 个 数值 ， 其 实 是 当 你 没有 感染 埃 博 拉 病毒 时 ， 化 验 结果 正确 的 概 
率 。 换 句 话 说 ，90% 这 个 数字 是 当 你 没有 感染 埃 博 拉 病毒 时 ， 化 验 结果 为 阴性 的 
概率 ， 记 为 PHO ( 回 指 的 是 你 健康 的 情况 )。 于 是 剩 下 的 10% 对 应 着 在 没有 感 
染病 毒 时 获得 阳性 结果 的 概率 PAO] 
要 确定 当 获 得 阳性 结果 时 你 感染 病毒 的 概率 ， 我们 需要 证 明 并 应 用 贝 叶 斯 定 
理 。 为 此 ， 我 们 写 出 逆 概 率 PAS] 的 定义 P[ 罗 @]=P[ 罗 日 @]/P[@]。 注 意 到 了 
吗 ? 这 里 的 分 子 与 条 件 概 率 PEP] 的 定义 中 的 分 子 是 一 样 的 ! 由 此 得 出 ， 两 个 事 
件 同时 发 生 的 概率 可 以 写成 P[p 日 @]=PI@]P[99@]。 这 相当 于 感染 病毒 昌 化 验 结 
果 为 阳性 的 概率 ， 等 于 先 感染 病毒 ， 然 后 在 已 知 感染 病毒 的 情况 下 化 验 结果 为 
阳性 的 概率 。 

我 们 几乎 完成 贝 叶 斯 定理 的 证 明了 。 现 在 只 需要 将 上 面 的 公式 代入 条 件 概率 
PIS 的 定义 之 中 ， 就 能 得 到 本 书 介绍 的 知识 哲学 中 最 重要 的 公式 ， 也 就 是 贝 叶 
斯 公式 。 请 花 点 时 间 仔 细 品 味 它 形式 上 的 优雅 以 及 符号 遵循 的 模式 。 


Pi9|el pie] 
TP[9] 


换 名 话说 ， 要 在 化 验 结果 为 阳性 的 情况 下 确定 感染 埃 博 拉 病 毒 的 概率 ， 只 需 
要 将 感染 病毒 时 化 验 结果 为 阳性 的 概率 (这 需要 一 点 想象 力 ) 乘 以 感染 埃 博 拉 病 
毒 的 先 验 概率 ， 然 后 除 以 化 验 结果 为 阳性 的 概率 。 
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就 像 作为 导论 的 第 1 章 所 说 的 ， 你 需要 知道 的 就 具有 乘法 和 除法 ! 还 有 比 这 
更 简单 的 吗 ? 

让 这 个 公式 如 此 难以 理解 的 ， 当 然 并 非 其 中 必须 用 到 的 计算 ， 而 是 如 何 解 释 
其 中 的 每 一 项 ， 这 些 项 至 少 在 本 章 内 简化 过 的 例子 中 都 可 以 解释 。 在 考虑 这 些 项 
的 时 候 ， 很 容易 产生 误解 。 我 只 能 请 你 多 花 时 间 思 考 。 























贝 叶 斯 公式 的 组 成 部 分 





等 式 右边 的 概率 pLe] 被 称 为 先 验 概率 。 这 就 是 我 们 在 看 到 化 验 结果 之 前 可 能 
(或 应 该 ) 认为 的 概率 。 在 这 里 ， 我 们 估算 这 个 概率 的 方法 ， 就 是 将 自己 的 情况 与 
在 撒哈拉 以 南 的 非洲 国家 人 口中 统计 得 到 的 埃 博 拉 病 毒 感染 人 数 进 行 比较 。 但 这 
只 是 一 个 粗略 的 估计 ， 况 且 我 们 没有 考虑 在 尼日利亚 滞留 的 时 间 ， 这 毫 无 疑问 是 
先 验 置信 度 的 决定 性 因素 。 同 样 重要 的 还 有 与 尼日利亚 当地 人 互动 的 频率 ， 以 及 
与 感染 者 接触 导致 的 暴露 。 要 量化 所 有 这 些 因素 可 谓 难于 登 天 。 我 们 在 这 里 就 只 
取 之 前 的 粗略 估计 。 

等 式 右 边 分 子 的 另 一 项 ， 就 是 在 感染 埃 博 拉 病 毒 后 化 验 结果 为 阳性 的 概率 
P[ 罗 @]。 这 一 项 需要 一 些 想象 力 。 我 们 需要 跳出 现实 世界 ， 想 象 在 某 种 平行 世界 
中 ,我 们 知道 自己 感染 了 埃 博 拉 病 毒 。 在 这 个 平行 世界 里 ,我 们 得 到 的 化 验 结果 
为 阳性 的 可 能 性 是 多 少 ? 这 个 问题 的 答案 就 是 PAS]. 
纯粹 贝 叶 斯 主义 考 跟 我 们 不 一 样 ， 她 不 仅 能 够 设 号 处 地 想象 别人 想象 的 东西 ， 
而 且 事实 上 她 整 天 都 在 这 样 想象 ! 这 就 是 著名 的 思想 实验 的 艺术 。 这 种 实验 事实 
上 对 于 贝 叶 斯 哲学 来 说 必 不 可 少 。 没 有 这 些 实验 ， 我 们 就 不 可 能 估计 像 PAS] 这 
样 的 项 ， 也 就 不 可 能 应 用 贝 叶 斯 公式 。 这 对 纯粹 贝 叶 斯 主义 者 来 说 就 是 非 理 性 的 。 

遗憾 的 是 ， 有 些 人 往往 会 断然 拒绝 单单 为 了 探索 某 个 理论 的 后 果 而 暂时 接受 
它 那 些 反 直觉 的 前 提 。 人 争论 双方 很 多 时 候 只 愿意 以 自身 的 知识 论 、 自 身 对 现实 的 
模型 、 自 身 的 神学 与 道德 观点 看 这 个 世界 。 如 果 没 有 共同 前 提 的 话 ， 这 样 的 争论 
定 变 成 空 对 空 。 这 种 争论 常常 跳 过 了 对 类 似 PI9Le] 的 项 的 计算 。 

这 样 的 项 被 统计 学 家 统一 称 为 似 然 度 。 然 而 ， 在 我 看 来 这 个 术语 不 太 合 适 ， 















































































































































22 | 贝 叶 斯 的 博弈 : 数学 、 思 维 与 人 工 智 名 








[yy 


因为 它 很 容易 导致 误解 。 实 际 上 ， 我 们 最 好 记 住 一 点 : 似 然 度 其 实 是 在 给 定 关于 
这 个 世界 的 某 个 假说 时 ， 观 察 到 现 有 数据 的 似 然 度 。 这 跟 某 个 假说 在 已 知 观 察 数 
据 下 的 似 然 度 完全 不 同 。 即 使 之 后 我 有 时 候 会 接受 通用 的 术语 ， 但 为 了 避免 之 后 
可 能 出 现 的 混乱 ， 我 更 倾向 于 将 这 些 项 叫 作 思想 实验 项 。 

最 后 剩 下 的 就 是 等 式 右边 的 分 母 ， 也 就 是 化 验 结果 为 阳性 的 概率 严 罗 。 这 一 
项 很 麻烦 ， 是 贝 叶 斯 公式 中 最 大 的 困难 。 就 是 这 一 项 让 许多 研究 概率 (或 者 人 工 
智能 ) 的 研究 者 度 过 了 许多 不 眠 之 夜 。 这 一 项 又 叫 边缘 概率 或 配 分 函数 。 它 对 我 
来 说 也 是 最 难看 清 、 最 难 理解 的 一 项 ， 即 使 它 在 本 章 的 某 些 简化 情况 中 显而易见 。 

要 计算 化 验 结果 为 阳性 的 概率 p[ 罗 ]， 就 要 区 分 两 种 情况 ， 因 感 染 埃 博 拉 病毒 
而 化 验 结果 为 阳性 ， 还 有 化 验 不 完美 导致 结果 为 阳性 。 对 每 一 种 情况 ， 我 们 都 要 
将 其 先 验 概 率 乘 以 这 种 情况 导致 阳性 结果 的 概率 。 换 句 话 说， 我 们 要 用 到 所 谓 的 
全 概率 公式 






























































PIP] = PIPS] Ple] + PIPIO] PO 
这 样 的 话 ， 配 分 函数 [S] 的 计算 需要 两 个 思想 实验 ,分别 对 应 两 个 不 同 的 情况 ， 
因此 它 的 计算 很 困难 。 贝 叶 斯 主义 者 应 该 训练 自己 进行 这 项 精细 的 脑力 体操 一 一 
自己 在 互 不 兼容 的 现实 可 能 性 之 中 进行 思考 的 能 力 。 这 大 概 就 是 贝 叶 斯 公式 如 此 
难以 应 用 与 理解 的 原因 。 
























































贝 叶 斯 主义 对 化 验 结果 的 解读 











最 后 ， 我 们 将 全 概率 公式 与 贝 叶 斯 公式 结合 ， 得 到 : 





[9e] Pe] 
[6] + PIO] PO] 





P 
我 们 现在 差不多 知道 了 等 式 右边 所 有 的 项 。 我 们 已 经 看 到 pre] 估计 约 为 1100002， 由 


此 可 以 得 到 PO] 至 少 是 9999/10 000。 然 后 我 们 注意 到 PRO] 对 应 着 健康 的 人 化 























CD 跟 贝 叶 斯 公式 一 样 ， 全 概率 公式 可 以 通过 条 件 概 率 的 定义 ， 以 及 两 个 独立 事件 发 生 的 概率 就 
是 两 个 事件 的 概率 的 和 这 个 事实 推出 。 
EL EE TER 
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Jin 
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验 结果 出 错 的 概率 ， 之 前 我 们 已 经 知道 这 个 概率 是 10%。 最 后 剩 下 的 就 是 PAS], 
也 就 是 对 于 感染 埃 博 拉 病 毒 的 人 来 说 化 验 结果 的 可 靠 性 。 我 们 注意 到 一 个 简单 的 
事实 : 这 一 项 是 一 个 概率 ,不 能 大 于 1。 将 这 些 事实 总 结 起 来 ， 通 过 下 面 的 计算 就 


Ab 
用 导出 : 


























1x0.0001 
Plel# x =~ 0.001 
ei 1x0.0001 + 0.1x0.9999 








也 就 是 说 ， 你 即便 知道 化 验 结果 是 阳性 ， 但 这 个 结果 告诉 你 ， 你 真正 感染 埃 
博 拉 病毒 的 概率 小 于 1/1000。 这 个 概率 小 得 很 ， 可 以 忽略 ， 所 以 你 还 不 需要 立刻 
开始 写 遗 嘱 。 

这 里 发 生 了 什么 ? 为 什么 最 终 的 结果 那么 小 ? 我 们 应 该 如 何 引 导 自 己 的 直觉 ， 才 
能 在 不 依靠 对 计算 的 盲目 信任 感知 到 最 终结 果 有 和 多 小 ?我 请 你 自己 思考 这 些 问 题 。 

关于 分 母 中 的 配 分 函数 ， 我 要 说 点 有 用 的 题 外 话 。 我 们 刚才 看 到 ， 这 个 数 分 
为 两 部 分 : 感染 埃 博 拉 病 毒 的 情况 ， 以 及 化 验 出 错 的 情况 。 这 两 种 情况 的 概率 绝 
对 不 一 样 。 事 实 上 ， 感 染 埃 博 拉 病毒 的 情况 发 生 的 概率 是 化 验 出 错 情 况 的 1/1000. 
两 种 情况 的 差异 如 此 巨大 ， 我 们 在 计算 配 分 函数 时 完全 有 理由 忽略 感染 埃 博 拉 病 
毒 的 情况 。 

这 样 的 话 ， 贝 叶 斯 公式 就 是 一 个 单纯 的 比值 ， 其 分 子 不 变 ， 计算 的 仍 是 感染 
埃 博 拉 病毒 的 情况 ,分母 计算 的 则 是 化 验 出 错 的 情况 。 于 是 贝 叶 斯 公式 比较 的 就 
是 化 验 结果 为 阳性 的 两 种 不 同 解释 。 最 终 公 式 得 到 的 结果 很 小 ， 可 以 解释 为 感染 
埃 博 拉 病毒 的 情况 远 比 化 验 出 错 更 不 可 能 发 生 。 

解释 贝 叶 斯 公式 的 另 一 种 方法 就 是 置信 度 的 转移 。 也 就 是 说 ， 思 想 实验 项 
小 的 理论 会 失去 置信 和 度 ， 而 思想 实验 项 大 的 理论 就 会 从 中 获 益 。 在 这 一 情况 中 ， 
PIPO] - 1096 是 iP[9]e] = 1 的 110。 所 以 @ 的 置信 和 度 会 上 升 为 此 前 的 10 倍 ， 代 价 
AEG EHE PER. SRI eg CN BECK BEER 1/10 000， 所 以 @ 的 后 验 概率 只 
是 回 的 1/1000?。 

在 今天 ， 医 务 人 员 实际 上 会 尝试 保护 你 免 受 无 谓 的 恐惧 ， 方 法 就 是 将 多 个 尽 













































































le Pere , lel 
器 本 PPO PIS] PO 





D 这 对 应 着 如 下 的 严格 计算 : E 

















[ay 
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可 能 独立 的 化 验 组 合 起 来 ， 只 有 在 大 量 的 化 验 结果 都 是 阳性 的 时 候 ， 医 务 人 员 才 
会 做 出 阳性 的 诊断 。 也 就 是 说 ， 医 务 人 员 会 尝试 尽量 降低 健康 人 群 获得 阳性 结 
的 概率 PIPO] 














贝 叶 斯 主义 对 萨 莉 克拉克 的 辩护 











为 了 更 好 地 理解 贝 叶 斯 公式 ,我 们 现在 将 它 应 用 到 萨 莉 :克拉克 的 情况 中 。 
我 们 想 要 知道 在 已 知 两 名 新 生 儿 死亡 的 情况 下 她 无 罪 的 概率 。 现 在 我 们 写 出 贝 叶 


斯 公式 。 




















" P[&|e]p[e] 
IP[8] e ]p[ e] + PII 

跟 刚 才 一 样 ， 我 们 需要 思考 三 个 数值 : 萨 竹 ' 克拉 克 无 罪 的 先 验 概率 PL], 
以 及 两 个 思想 实验 项 pen es ] 和 P[ 全 | 历 |， 分 别 对 应 在 萨 莉 "克拉 克 无 罪 和 有 罪 的 
前 提 下 ， 两 名 新 生 儿 死亡 的 概率 。 

我 们 先 考虑 萨 莉 . 克拉克 无 罪 的 先 验 概率 ， 它 必定 非常 重要 。 这 个 先 验 概率 ， 
就 是 某 个 任意 选 定 的 人 没有 杀 死 自己 的 两 名 新 生 儿 的 概率 。 然 而 ， 绝 大 部 分 人 没 
有 杀 死 过 自己 的 两 名 新 生 儿 ! 实际 上 ， 和 硕 尔 医生 估计 萨 莉 ' 克拉 克 有 罪 的 先 验 概 
率 大 约 是 500 万 分 之 一 ! 

这 就 支持 了 无 罪 推 定 。 对 于 严重 犯罪 ,在 没有 犯罪 证 据 的 情况 下 ， 任 何人 无 
罪 的 可 能 性 都 远 远 大 于 有 罪 的 可 能 性 。 所 以 无 罪 推 定 就 是 正确 的 先 验 假设 。 然 而 ， 
无 罪 推定 不 能 被 推广 到 适用 范围 以 外 ， 它 只 对 应 没有 犯罪 证 据 时 的 先 验 假定 。 如 
果 众 多 证 据 都 指向 嫌疑 人 有 罪 , 那么 嫌疑 人 无 罪 的 概率 会 降低 到 小 于 有 罪 的 概率 。 
但 证 据 可 能 也 并 不 足够 。 

纯粹 贝 叶 斯 主义 者 会 迫使 我 们 应 用 贝 叶 斯 公式 ， 以 更 好 地 理解 在 面 对 指 控 的 
证 据 时 ， 什 么 程度 的 怀疑 才 是 适当 的 。 特 别 是 ， 至 少 在 必须 解释 如 何 计算 出 应 该 
以 什么 程度 来 怀疑 时 ， 她 不 会 只 引用 无 罪 推 定 得 出 结论 ， 因 为 这 个 概念 假定 了 指 
控 的 证 据 不 存在 。 

现在 我 们 来 考虑 思想 实验 项 。 在 萨 莉 : 克拉 克 无 罪 的 前 提 下 ， 两 名 新 生 儿 死 
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亡 的 概率 PLA e ] 对 应 的 是 自然 死亡 的 情况 。 这 就 是 前 文 所 述 的 7000 万 分 之 一 这 
个 数值 ( 这 个 估算 值 偏 低 ) 最后， 在 萨 莉 ' 克拉克 有 罪 的 前 提 下 ， 两 名 新 生 儿 死 
亡 的 概率 等 于 1。 

我 们 现在 可 以 将 所 有 已 知 数值 结合 起 来 ， 进 行 如 下 的 计算 : 


70 i 000 i 
Piel") & 1 














1 & 0.88 


xl+1x 
70 000 000 5 000 000 000 





KAW, BEWA EJL H RIEC ME MAR, BER 克拉 克 无 罪 的 概率 仍 
然 非 常 大 。 她 无 罪 的 可 能 性 仍然 比 有 罪 大 得 多 。 判 决 萨 和 克拉克 有 罪 似乎 并 不 
合理 ， 即 使 如 我 们 在 第 1 章 看 到 的 ， 这 个 判断 处 于 贝 叶 斯 主义 的 框架 之 外 。 

目前 为 止 ， 我 们 将 贝 叶 斯 公式 应 用 到 了 两 个 实际 例子 之 中 。 正 如 应 用 数学 中 
的 很 多 情况 那样 ， 这 些 实际 例子 其 实 已 经 很 难 准确 理解 了 。 毕 竞 准确 估计 感染 埃 
博 拉 病毒 的 先 验 概 率 P[@] 和 新 生 儿 自然 死亡 的 概率 PA e] 实际 上 非常 困难 。 因 
此 不 能 忘记 ， 最 终 得 到 的 结果 必然 是 一 种 近似 。“ 所 有 模型 都 是 错 的 。 

因此 ， 纯 粹 贝 叶 斯 主义 者 不 会 坚信 任何 人 得 到 的 数值 结果 ， 甚 至 聪明 得 会 计 
算 自己 对 于 Pe] A Pa e ] 的 各 种 不 同 数值 得 到 的 结果 的 置信 和 度 。 但 如 果 法 官 要 
求 她 给 出 唯一 的 结果 ， 那 么 她 会 以 置信 度 为 权重 ， 计 算得 到 的 不 同 结果 的 加 权 平 
均值 。 她 也 会 注意 到 当 化 验 结果 呈 阳 性 时 感染 埃 博 拉 病 毒 的 概率 只 会 非常 小 ， 而 
DA :克拉克 案 件 的 结果 没有 那么 牢靠 ， 所 以 结果 并 不 明确 。 




















































































































小 孩 迹 题 终于 解决 了 1! 











最 后 我 想 向 你 展示 如 何 用 贝 叶 斯 公式 来 解答 那 位 “钓鱼 ”学 生 的 问题 。 回 忆 
一 下 ， 在 两 个 孩子 小 晨 和 小 迪 之 中 ,至 少 有 一 个 是 男孩 ,那么 另 一 个 孩子 也 是 男 
孩 的 概率 是 多 少 ? 我 们 之 前 已 经 看 到 ， 这 相当 于 在 小 晨 或 小 迪 是 男孩 的 前 提 下 ， 
求 小 晨 和 小 迪 都 是 男孩 的 概率 。 

为 了 简化 记号 ， 我 们 将 “小 晨 是 男孩 ” 记 作 Co ， 将 “小 迪 是 男孩 ” 记 作 
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[aj 





Da, 在 小 晨 或 小 迪 是 女孩 的 情况 下 ， 我 们 也 会 用 到 9 这 个 符号 。 于 是 贝 叶 斯 公式 
可 以 写成 : 


? PPICc 3X De |C H Dce']P[Cc H Do] 


PCS H. De|Co 3xX Do P[Cc sk Do] 

















先 验 概 率 PLCAH Do ] 就 是 小 晨 和 小 迪 都 是 男孩 的 先 验 概率 ， 它 等 于 UA. 

思想 实验 项 PICAR DIC) H DA] 就 是 在 小 晨 和 小 迪 都 是 男孩 的 情况 下 ， 
他 们 之 中 有 一 个 是 男孩 的 概率 。 但 “有 一 个 是 男孩 ”这 个 条 件 正 是 “两 个 都 是 男 
孩 ” 的 逻辑 推论 ， 所 以 这 个 概率 等 于 1。 

最 后 剩 下 的 就 是 配 分 函数 P[Co 或 Do]。 它 对 应 着 小 晨 和 小 迪 的 4 种 性 别 组 
合 中 的 3 种 可 能 性 。 

另外 ， 我 们 也 可 以 解释 本 章 开 头 的 推理 的 合理 性 。 在 排除 女孩 -女孩 的 假设 
之 后 ， 男 孩 - 男 孩 、 男 孩 - 女 孩 、 女 孩 - 男 孩 这 三 种 假设 的 可 能 性 相等 ， 因 为 这 
三 个 假设 的 思想 实验 项 都 等 于 1。 所 以 这 三 个 假设 之 间 并 没有 置信 和 度 的 传道"。 癌 

就 这 样 ， 我 们 得 到 了 所 有 需要 的 数据 ， 剩 下 的 就 是 计算 。 于 是 我 们 得 到 
1x(1/4)/(3/4)， 等 于 13。 这 就 是 我 们 在 本 章 开 头 利用 不 严谨 的 “ 手 算 ” 得 到 的 结果 。 

























































































几 句 鼓励 的 话 




















本 章 的 贝 叶 斯 计算 并 不 简单 。 每 个 计算 都 需要 整整 一 页 来 明确 解释 ， 即 使 是 
最 喜欢 数学 的 人 也 会 被 吓 倒 。 的 确 ， 即 使 在 最 简单 的 情况 下 ， 实 际 应 用 贝 叶 斯 公 
式 也 很 难 ， 理 解 它 就 更 难 了 。 正 如 一 般 的 数学 内 容 ， 这 个 公式 的 抽象 性 和 复杂 程 
度 足 以 吓 退 我 们 之 中 不 够 勇敢 的 那些 人 。 

我 只 能 鼓励 你 坚持 不 懈 。 贝 叶 斯 公式 对 所 有 人 来 说 都 很 难 理解 。 即 使 是 大 数 
学 家 也 难以 将 它 应 用 到 类 似 蒙 带 : 霍 尔 问 题 这 样 的 简化 情况 中 。 即 使 冰 力 再 强 ， 
你 也 不 能 完全 理解 贝 叶 斯 公式 ， 但 你 可 以 在 对 它 的 理解 上 取得 长 足 的 进展 。 为 了 
































中 ”这 个 问题 有 一 个 变 体 ， 我 们 随机 选取 一 个 孩子 并 得 知 他 是 个 男孩 。 这 时 ， 男 孩 - 女孩 以 及 女 
fi - 男孩 两 种 情况 的 思想 实验 项 不 等 于 1， 这 就 会 产生 置信 度 的 传递 ， 得 到 的 结论 也 不 一 样 。 
书后 注释 [2] 中 的 视频 讨论 了 这 个 问题 变 体 。 


























做 到 这 一 点 ， 你 要 努力 奋斗 ， 不 能 放弃 。 要 付出 的 代价 就 是 大 量 脑力 劳动 ， 但 其 
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回报 绝对 丰厚 。 对 于 纯粹 贝 叶 斯 主义 者 来 说 ， 最 终 能 够 (足够 ) 正确 思考 的 能 
就 在 航程 的 终点 。 
然而 ,仅仅 阅读 这 本 书 还 不 够 。 数 学 的 学 习 在 于 练习 ， 在 于 让 头脑 摆弄 抽象 


的 对 象 ， 在 于 自 











己 不 断 尝试 阅 明 数学 概念 。 不 停 地 思考 数学 才能 变 得 擅长 数学 。 

















所 以 请 你 不 断 重复 本 章 
上 还 是 在 散步 中 。 当 你 觉得 自己 准备 好 了 ， 就 请 你 尝试 解决 蒙 带 : 堆 尔 问题 ， 然 
厨 尝试 解决 小 孩 广 题 的 第 二 部 分 一 一 正确 答案 是 13/27。 

努力 吧 ， 我 能 给 你 的 最 重要 的 建议 就 是 不 断 尝试 从 中 找到 乐趣 。 我 在 之 后 的 章 
节 中 最 强调 的 就 是 这 种 乐趣 。 特 别 是 ， 贝 叶 斯 公式 如 此 紧凑 、 如 此 充满 陷阱 ， 同 
时 它 对 于 理解 这 个 世界 来 说 又 如 此 重要 ， 这 个 事实 本 身 就 包含 了 某 种 令 人 极度 着 


迷 的 东西 。 比 如 说 ， 我 们 已 经 看 到 了 贝 叶 斯 公式 能 解释 为 什么 最 好 的 医疗 化 验 也 并 
十 么 在 法 律 中 无 罪 推定 如 此 切合 实际 。 这 些 还 只 是 起 点 ! 














非 毋 庸 置疑 的 ， 还 有 为 











贝 叶 





斯 公式 的 优雅 ， 























的 那些 贝 叶 斯 推理 ， 无 论 是 在 空闲 时 、 在 淋浴 时 、 在 路 




































































还 有 它 的 推论 将 我 引 向 了 不 可 胜 数 的 快乐 思考 ， 从 中 得 














出 的 知识 哲学 让 我 一 直 感受 着 快乐 和 幸福 。 正 因 如 此 ， 我 最 终 得 出 ， 贝 叶 斯 公式 
是 数学 中 最 优美 的 等 式 。 





逻辑 将 我 们 带 到 比 其 他 任何 学 科 离 天 国 更 近 
的 地 方 。 
伯 特 兰 . 罗素 (1872—1970 ) 
亚 里 士 多 德 式 逻 辑 推广 到 关于 可 能 性 的 任何 
理论 都 同 构 于 贝 叶 斯 概率 论 。 
RFE- KAALA 


PRE 
MUSÉE 


两 种 思考 模式 




















假设 有 人 对 你 说 :“ 如 果 一 张 扑 克 牌 的 正面 是 Q,， 那么 它 的 背面 就 是 蓝 色 的 。 
也 就 是 说 ， 我 们 考虑 “这 一 B” 这 个 假设 。 你 面前 有 4 张 牌 ， 第 一 张 正面 朝 上 ， 
是 Q; 第 二 张 正 面 朝 上 ,是 10; 第 三 张 背 面 朝 上 ， 是 蓝 色 的 ; 第 四 张 背面 朝 上 ， 
是 红色 的 (图 3.1 )。 检验 之 前 的 假设 需要 翻转 哪些 牌 ? 
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图 3.1 从 左 到 右 分 别 是 Q、10、 蓝 色 牌 和 红色 牌 
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实验 者 向 许多 人 问 过 这 个 问题 。 在 被 询问 的 数 千 人 中 ， 只 有 4% 的 人 给 出 了 
正确 答案 。 请 你 也 思考 一 下 ， 不 要 掉 到 陷阱 里 。 我 强烈 建议 你 在 选择 好 答案 之 后 ， 
去 看 看 Hygiene Mentale 的 精彩 视频 中。 


科学 哲学 以 及 知识 哲学 在 传统 上 会 区 分 两 种 非常 不 同 的 推理 ， 分 别 是 演绎 推 














理 和 归纳 推理 。 学 校 里 通常 教 的 是 ， 科 学 研究 者 应 该 结合 这 两 种 推理 ， 进 行 所 谓 
的 “假说 -演绎 推理 ”"。 这 就 是 你 在 上 述 迹 题 中 应 该 部 分 采取 的 研究 方法 ， 从 某 个 
假设 出 发 ， 你 应 该 推断 出 它 的 后 果 并 对 其 进行 测试 。 

作为 一 名 合格 的 数学 研究 者 ， 我 很 快 就 爱 上 了 这 种 推理 中 的 演绎 部 分 ; 但 作 
为 一 名 合格 的 数学 研究 者 ， 我 同样 一 直 不 满意 科学 方法 的 归纳 部 分 。 我 经 常 觉得 
那 只 是 一 种 权宜 之 计 ， 经 不 起 推 殴 ， 也 与 研究 人 员 的 日 常生 活 相去 其 还。 更 糟糕 
的 是 ， 我 常常 有 一 种 印象 : 很 多 科学 方法 的 支持 者 在 其 酌 科 学 方法 的 描述 时 ， 都 
有 一 种 策略 性 目的 ， 就 是 将 科学 和 伪 科 学 区 分 开 来 。 我 经 常 觉得 ， 他 们 对 “科学 ” 
的 定义 背后 隐藏 着 某 种 “科学 流 识 ” 的 行径 ， 在 保卫 科学 共同 体 的 愿望 驱使 下 将 
错误 的 事情 合理 化 。 这 种 “ 流 误 ” 行 径 尤其 喜欢 遮掩 归纳 推理 中 的 困难 ， 对 我 来 




















说 这 是 个 相当 严重 的 问题 。 
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不 要 误会 ， 指 出 科学 与 伪 科 学 在 可 靠 性 上 的 差异 这 一 点 非常 重要 ， 我 会 在 之 
后 的 章节 中 用 更 多 篇 幅 强 调 这 一 点 。 但 我 更 愿意 现在 就 说 清楚 一 点 : 我 对 “科学 
方法 ”感到 不 自在 ， 不 代表 我 要 否定 科学 研究 的 结论 ， 更 不 代表 我 会 转 而 接受 伪 


科学 。 特 别 是 我 们 之 后 会 看 到 ， 


大 的 置信 和 度 。 























有 一 条 贝 叶 斯 原则 会 让 我 们 向 科学 共识 赋予 非常 


且 在 讨论 那些 内 容 之 前 ， 我 们 先 回 到 演绎 推理 和 归纳 推理 的 区 别 上 。 对 于 今 








天 受过 正式 训练 的 科学 工作 者 来 说 ， 这 个 区 别 似乎 是 显然 的 。 但 有 趣 的 是 ， 纯 粹 
贝 叶 斯 主义 者 并 不 会 做 出 这 样 的 区 分 。 对 她 来 说 ， 推 理 方式 只 有 一 种 ， 那 就 是 贝 
叶 斯 公式 。 更 准确 地 说 ， 整 个 归纳 推理 系统 都 只 是 贝 叶 斯 公式 的 特例 ， 而 人 们 和 党 


















































用 的 归纳 推理 则 不 过 是 贝 叶 斯 公式 的 一 种 错误 近似 。 








当 我 领悟 到 这 一 点 的 时 候 ， 


确信 自己 必须 着 手写 这 本 书 ! 








整个 人 都 惊 呆 了 。 正 是 这 项 发 现 与 其 他 东西 让 我 





我 们 在 本 章 中 只 考虑 演绎 推理 ， 下 一 章 再 讨论 归纳 推理 。 在 这 里 ， 我 们 会 看 
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到 演绎 推理 实际 上 要 比 人 们 的 朴素 认 知 更 精细 、 更 违反 直觉 ， 也 更 星 涩 。 实 际 上 ， 
与 一 些 接 受过 专业 训练 的 科学 工作 者 的 想法 相反 ， 演 绎 逻辑 有 数 种 。 我 们 还 会 看 
到 贝 叶 斯 逻辑 与 目前 在 学 校 中 讲授 的 逻辑 相 比 也 毫 不 逊色 。 


























逻辑 的 规则 





逻辑 推理 的 经 典 例子 就 是 亚 里 士 多 德 的 三 段 论 ， 它 先 考 虑 下 面 两 个 前 提 : 

e 所 有 人 都 会 死 ; 

e 苏 格 拉 底 是 人 。 

亚 里 士 多 德 断 言 这 两 个 前 提 会 引出 下 面 的 结论 ”: 

e 因此 ， 苏 格拉 底 会 死 。 

亚 里 士 多 德 的 逻辑 似乎 无 可 挑剔 。 它 看 上 去 如 此 自然 ， 其 正确 性 不 容 置疑 。 
几 年 前 ， 一 位 朋友 向 我 提出 挑战 ， 说 我 不 可 能 怀疑 亚 里 士 多 德 的 三 段 论 ， 我 承认 
了 自己 做 不 到 。 

然而 ， 亚 里 士 多 德 的 这 个 三 段 论 启 发 了 众多 哲学 家 、 逻 辑 学 家 和 数学 家 ， 他 
们 接 下 来 进行 了 认真 的 分 析 ， 目 的 是 确定 逻辑 的 规则 。 这 些 逻 辑 规则 又 叫 作 替 换 
规则 与 肯定 前 件 规 则 。 如 同 现代 数学 那样 ， 亚 里 士 多 德 的 三 段 论 实际 上 基于 这 两 
条 逻辑 规则 。 要 理解 它们 ， 最 好 从 一 个 比 亚 里 士 多 德 的 三 段 论 更 简单 的 情况 出 发 。 
考虑 下 面 这 个 包含 两 个 事件 的 例子 : 

P: 现在 正在 下 雨 ; 

T: RETE 

每 个 事件 都 可 能 是 真 的 或 者 假 的 。 这 两 个 事件 又 被 称 为 布尔 变量 ， 由 此 出 发 
可 以 构建 新 的 事件 ， 我 们 把 这 些 新 事件 叫 作 逻辑 公式 。 比 如 说 ， 我 们 可 以 构造 
“ 非 合 ”“ 合 或 者 个 ”甚至 “ 合 且 全” 这 些 公 式 ， 甚 至 还 有 类 似 (1e) 或 者 个 ”这 
种 更 复杂 的 公式 。 要 理解 这 些 公式 ， 一 种 有 用 的 方法 就 是 构造 它们 的 真 值 表 




























































































中 ”实际 上 ， 亚 里 士 多 德 似 乎 没有 考虑 过 这 样 的 三 段 论 ， 因 为 他 的 理论 不 考虑 个 体 的 情况 〈 因此 其 
推理 中 不 接受 第 二 个 前 提 ) 这 与 斯 多 葛 主 义 者 的 角度 相反 ， 他 们 发 展 了 命题 逻辑 ， 我 们 之 后 会 
讨论 。 更 详细 的 讨论 请 见 吉尔 ， 多 维 克 的 杰作 《计算 进化 史 》( 人 民 邮 电 出 版 社 ，2017 年 )。 
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CR 1), 根据 布尔 变量 的 真 值 询 出 逻辑 公式 的 真 值 。 











表 1 “现在 正在 下 雨 或 者 我 带 了 雨伞 ”的 真 值 表 





党 =W s 
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比如 说 ， 在 表 1 中 ， 中 间 一 行 对 应 盒 ， 也 就 是 “现在 正在 下 雨 ”的 情况 ， 而 
中 间 一 列 则 对 应 合 ， 也 就 是 “我 带 了 伞 ” 的 情况 。 所 以 ， 正 中 间 的 格子 代表 当 念 和 
个 同时 为 真 时 ,“ 盒 或 者 个 ”的 逻辑 真 值 。 这 个 格子 指出 ， 如 果 仿 和 个 都 为 真 的 话 ， 
那么 “ 邻 或 者 个 ”也 为 真 。 请 你 花 点 时 间 自 己 分 析 这 个 真 值 表 ， 并列 出 其 他 逻辑 公 
式 的 真 值 表 。 

目前 为 止 ， 我 们 还 只 研究 了 由 两 个 布尔 变量 组 成 的 公式 ， 但 我 们 可 以 更 进 一 
步 ， 考 虑 由 3 个 、8 个 甚至 更 多 布尔 变量 组 成 的 公式 。 为 了 列 出 这 些 布尔 变量 所 有 
可 能 的 取 值 组 合 ， 这 些 公式 的 真 值 表 当然 会 变 得 更 庞大 。 你 可 以 计算 一 下 这 些 巨 
大 的 真 值 表 有 多少 项 ， 以 及 所 有 可 能 的 真 值 表 的 数目 。 但 我 非常 不 建议 你 列 出 包 
含 3 个 或 以 上 布尔 变量 的 所 有 真 值 表 ， 毕 竟 3 个 布尔 变量 的 真 值 表 有 256 个 …… 
而 包含 8 个 布尔 变量 的 真 值 表 数目 约 等 于 宇宙 中 的 粒子 数 ! 
在 实践 中 ， 有 一 个 逻辑 公式 特别 重要 ， 那 就 是 “( 非 盒 ) 或 者 全 ， 通 常 我 们 也 
把 它 写 成 “ 令 一 他”"。 这 个 公式 可 以 直观 地 读 成 “ 令 蕴 涵 售 ”"， 或 者 “对 于 所 有 令 都 
有 他" ， 又 或 者 “如 果 合 那么 个 "。 请 你 多 花 点 时 间 思 考 这 个 公式 的 真 值 表 CR 2 )， 
它 一 定 会 令 没 有 仔细 思考 过 它 的 人 吃惊 。 

























































































*2 “如 果 下 雨 的 话 我 就 带 了 雨 个 ”的 真 值 表 
sy T-X 
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"eT" APSR MARIER, EAN CATER EA o. ARTE 
绎 正 是 从 前 提 合 出 发 ， 推 导出 结论 个。 如 果 列 涵 关 系 是 正确 的 ， 而 且 前 提 也 正确 ， 
那么 结论 本 身 也 必定 正确 。 用 符号 表示 的 话 ， 我 们 可 以 写 出 逻辑 公式 “(( 合 一 个 ) 
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且 令 ) 一 个 ”， 这 个 公式 就 是 我 们 所 说 的 肯定 前 件 7, CI 

你 可 以 将 代表 “和 列 涵 ”的 箭头 替换 成 它 的 定义 ， 用 我 们 之 前 定义 的 “或 
者 "”“ 且 ”和 “ 非 ” 来 表达 。 摆 弄 一 下 这 样 得 到 的 公式 ， 或 者 写 出 它 的 真 值 表 ， 你 
就 会 得 出 一 个 结论 : 无 论 仿 和 全 的 真 值 是 什么 ， 肯 定 前 件 推理 总 是 正确 的 。 我 们 说 
肯定 前 件 推理 是 一 个 重 言 式 ， 因 为 对 于 涉及 的 布尔 变量 所 有 可 能 的 真 值 ， 它 都 是 
对 的 。 

与 常识 相反 的 是 ， 在 逻辑 中 ， 重 言 式 可 能 一 点 都 不 “显然 "。 它 不 一 定 显 而 易 
见 或 不 言 而 喻 。 如 同 肯定 前 件 推理 ， 某 些 重 言 式 是 大 部 分 人 看 不 出 来 的 ， 我 们 需 
要 一 点 时 间 来 思考 。 
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Q 的 背面 都 是 蓝 色 的 吗 ? 








我 们 回 到 本 章 开头 的 扑克 牌 问题 。 回 忆 一 下 ， 我 们 要 测试 的 假设 是 如 一 B。 
你 面前 有 4 张 牌 ， 第 一 张 是 Q， 第 二 张 是 10， 第 三 张 背面 向 上 ， 为 蓝 色 ， 第 四 张 
背面 向 上 ， 为 红色 。 要 测试 这 个 假设 ， 需 要 将 几 张 牌 翻 过 来 ? 
第 一 张 牌 是 Q。 肯 定 前 件 推理 让 我 们 能 做 出 某 种 预测 。 的 确 ,“(( 这 一 B ) 1 
W) 一 B” 是 一 个 重 言 式 ， 如 果 要 测试 的 假设 正确 的 话 ， 那 么 ， 因 为 第 一 张 牧 是 
Q， 所 以 它 的 背面 就 是 蓝 色 的 。 于 是 一 开始 的 假设 预测 了 第 一 张 牌 的 背面 是 蓝 色 
的 。 如 果 有 牌 背 不 是 蓝 色 ， 那 么 要 测试 的 假设 就 被 否定 了 。 
第 二 张 牌 的 情况 恰恰 相反 ， 我 们 必须 看 到 ， 从 前 提 “( ws 一 B ) H (Ex) 
无 法 推出 B 的 真 值 。 这 张 牌 可 能 是 “ 非 癌 非 B” 或 者 “B 但 非 s%+”"。 第 三 张 牧 也 
是 同样 的 情况 ， 从 前 提 “( 党 一 B ) 且 B” 无 法 推出 党 的 真 值 。 这 张 牌 无 论 是 不 是 
一 张 Q， 都 与 要 测试 的 假设 相 容 。 你 最 好 多 论点 时 间 确 认 这 一 点 ， 其 中 一 种 方法 
就 是 写 出 这 些 逻 辑 公式 的 真 值 表 。 

然而 对 于 最 后 一 张 牌 ， 要 测试 的 假设 能 做 出 一 致 的 预测 。 的 确 ， 如 果 一 张 牌 
的 背面 不 是 蓝 色 ， 却 是 一 张 Q 的 话 ， 那 么 我 们 就 得 到 了 一 张 背 面 不 是 蓝 色 的 Q， 
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”实际 上 要 比 这 个 公式 更 加 复杂 。 为 了 保证 严谨 ， 必 须 将 元 语言 中 的 “蕴涵 ”和 “而 且 ” 与 描 
述 逻辑 的 语言 中 的 “-*” 和 “上 且 ”区 分 开 。 
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这 与 假设 矛盾 。 所 以 ， 要 对 一 开始 的 假设 进行 测试 ， 就 必须 将 最 后 这 张 牌 翻 过 来 
看 看 。 

与 第 一 张 牌 的 情况 一 样 ， 最 后 一 张 牌 也 对 应 着 一 个 重 言 式 ， 即 “(( 合 一 个 ) 且 
JP) 一 非 念 "， 这 就 是 否定 后 件 推理 。 这 个 重 言 式 也 可 以 改写 成 “( 登 一个) 一 
(IEP Te)", HAE, ARR ER "OT" AUR — T ADORA "dETo 
非 邻 "， 我 们 把 它 叫 作 逆 否 命题 。 实 际 上 ， 这 两 个 蕴涵 关系 其 至 是 等 价 的 。 

蕴涵 关系 与 其 逆 否 命题 的 等 价 性 是 逻辑 中 违反 直觉 的 众多 重 言 式 之 一 。 考 虑 
一 下 “所 有 乌鸦 都 是 黑色 的 ”这 个 假设 ， 它 的 道 否 命题 就 是 “所 有 不 是 黑色 的 东 
西 都 不 是 乌鸦 ”"。 然 而 ， 因 为 该 假设 与 它 的 逆 否 命题 是 等 价 的 ， 所 以 验证 道 否 命题 
就 相当 于 验证 假设 本 身 。 特 别 是 ， 每 个 红色 的 苹果 也 都 验证 了 “天 下 乌鸦 一 般 黑 ” 
的 假设 ! 这 个 结论 非常 反 直觉 , 但 在 逻辑 上 无 懈 可 击 ， 人 们 也 把 它 叫 作 乌 鸦 悖 论 
或 者 享 佩 尔 悖 论 。 从 经 验 上 来 说 ， 即 使 是 拥有 数学 博士 学 位 的 人 有 时 也 难以 预料 
或 接受 这 个 结论 ! 

男 一 个 逻辑 重 言 式 的 例子 就 是 分 类 讨论 ， 与 之 对 应 的 就 是 “(( 令 一 仿 且 ( 非 
pp) 一 售 ” 这 个 重 言 式 。 我 们 也 可 以 考虑 反 证 法 ， 又 叫 归 诬 法 ， 它 对 应 的 是 
"(e (THEM 一 ( 非 仿 )” 这 个 重 言 式 。 
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量词 与 谓词 


al 


我 们 目前 为 止 看 到 的 命题 逻辑 拥有 丰富 的 内 涵 ， 并 且 已 经 相当 反 直 觉 了 。 然 
而 ， 作 为 一 种 语言 ， 它 的 限制 实在 太 多 。 的 确 ， 命 题 逻辑 中 的 每 一 个 逻辑 公式 都 
只 能 牵涉 有 限 个 布尔 变量 ， 然 而 在 数学 和 科学 中 ， 人 们 常常 希望 考虑 所 有 可 能 
组 成 的 集合 ， 这 种 集合 可 能 无 限 大 。 

举 个 例子 ， 因 为 有 无 穷 个 数 ， 我 们 可 以 取 关 于 这 些 数 的 无 数 个 布尔 变量 。 典 
型 的 例子 就 是 存在 无 数 个 形 如 “n 是 偶数 ”的 命题 ,我们 可 以 给 每 个 整数 写 出 一 个 
这 样 的 命题 。 与 其 给 每 个 这 样 的 命题 起 不 同 的 名 字 ， 我 们 不 如 考虑 一 个 依赖 于 整 
数 n 的 命题 Even(n)。 我 们 将 “Even” 称 为 谓词 。 我 们 还 可 以 构建 更 复杂 的 谓词 ， 
比如 表示 “m+n=p” 的 谓词 Addition(m, n, p) 
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我 们 不 能 说 谓词 是 真 的 ， 只 能 说 谓词 总 是 真 的 、 总 是 假 的、 至 少 有 一 种 情况 
为 真 或 者 至 少 有 一 种 情况 为 假 。 这 四 种 说 法 对 应 着 不 同 的 量词 。 如 果 对 于 所 有 n 
来 说 P(n) 都 是 真 ， 那么 我 们 就 说 P(n) 总 是 真 的 。 在 谓词 逻辑 中 ， 这 句 话 可 以 紧 
凑 地 写成 VnP(n)。 符 号 v 读 作 “ 对 于 所 有 ”， 它 就 是 所 谓 的 全 称 量词 。 同 样 ， 如 果 
P(n) 总 是 假 的 ， 就 可 以 写成 Vn( 非 P(n))。 最 后 ,，“P(n) 至 少 对 于 某 个 的 值 是 对 
的 ”可 以 写成 3nP(n)， 如 果 P(n) 至 少 对 某 个 的 值 是 错 的 ， 就 写成 3n( 非 P(n))。 
符号 3 就 是 存在 量词 ， 读 作 “ 存 在 ”。 

关键 在 于 ， 在 一 个 逻辑 公式 中 ， 如 果 所 有 谓词 的 变量 都 被 全 称 量词 或 者 存在 
量词 量化 的 话 ， 它 就 变 成 了 一 个 或 真 或 假 的 命题 。 也 就 是 说 ，“ 是 偶数 ”这 个 句 
子 没有 对 错 之 别 ,但 量化 后 的 “vn(n 是 偶数 )” 和 “3n(n 是 偶数 )” 就 有 真 假 之 分 
了 。 你 可 以 自己 猜 猜 哪个 为 真 ， 哪 个 为 假 。 

于 是 ， 我 们 可 以 试 着 将 逻辑 符号 组 合成 更 有 趣 的 命题 ， 比 如 “vn((n 是 偶 
TE) (1288 ))" "Vndm(m»n)" RE "Vnvp3qadr(n-pq*r) H 0 <r<p)’, 
数学 工作 最 纯粹 的 形式 就 是 确定 谓词 逻辑 中 的 哪些 公式 是 重 言 式 。 如 果 发 现 了 一 
个 并 不 显然 的 重 言 式 ， 人 们 就 把 它 称 为 定理 。 








































































































重新 解释 亚 里 士 多 德 三 段 论 


我 们 终于 可 以 讨论 亚 里 士 多 德 的 三 段 论 了 。 这 个 三 段 论 要 讨论 的 对 象 不 是 数 
字 ， 而 是 人 。 第 一 个 前 提 断 言 “ 所 有 人 都 会 死 "， 它 描述 了 关于 人 的 两 个 谓词 之 间 
的 关系 。 用 逻辑 的 语言 重新 表述 的 话 ， 这 个 前 提 可 以 写成 vx(Human(x) — Mortal(x)), 
这 里 Human(x) 的 意思 是 “x 是 人 ”， 而 Mortal) 的 意思 是 “x 会 死 "。 第 二 个 前 提 
断言 “ 苏 格 拉 底 是 人 ”， 这 个 前 提 只 与 特定 的 x 值 有 关 , x 在 这 里 就 是 苏 格 拉 底 。 
我 们 可 以 将 它 重 新 写成 Human( 苏 格 拉 底 )， 这 是 一 个 布尔 变量 ， 我 们 假设 它 是 
真 的 。 

为 了 得 出 结论 , 我 们 希望 在 x 等 于 苏 格 拉 底 的 情况 下 援引 “Human(z) > Mortal)” 
这 个 再 涵 关 系 。 为 了 做 到 这 一 点 ， 逻 辑 学 家 发 明了 一 条 逻辑 规则 ， 叫 作 全 称 特 
化 。 在 苏 格 拉 底 的 例子 中 ， 这 条 规则 的 意思 就 是 如 果 苏 格拉 底 是 这 个 理论 的 对 
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Z, 而 且 有 前 提 为 “vx(Human(x) 一 Mortal(x))” 的 话 ， 那 么 “Human( 苏 格 拉 
底 ) ^ Mortal( 苏 格 拉 底 )” 这 个 逻辑 公式 就 是 真 的 ， 因 为 它 就 是 用 理论 中 的 对 象 
“ 苏 格 拉 底 ”替换 变量 x 后 得 到 的 公式 。 

现在 ,借助 肯定 前 件 推 理 ， 我们 就 能 得 出 结论 了 。 的 确 ， 因 为 蕴涵 关系 
"Human( 苏 格 拉 底 ) 一 Mortal( 苏 格 拉 底 )” 为 真 ， 而 更 涵 关系 的 前 提 Human( 苏 格 
拉 底 ) 也 为 真 ， 我 们 就 能 推出 蕴涵 关系 的 结论 也 为 真 。 于 是 我 们 就 得 到 了 Mortal( 苏 
格拉 底 )， 这 也 是 亚 里 士 多 德 的 结论 。 我 们 刚才 所 做 的 ， 就 是 借助 基础 逻辑 证 明了 
亚 里 十 多 德 三 段 论 的 正确 性 。 

你 可 能 会 有 这 样 的 疑问 ， 我 们 刚才 绞 尽 脑汁 做 的 事情 是 不 是 微不足道 ?毕竟 
我 们 早 就 知道 亚 里 士 多 德 的 三 段 论 是 对 的 ， 不 是 吗 ? 当然 是 ， 但 我 们 也 要 看 到 ， 
它 的 正确 性 是 基于 对 逻辑 规则 的 承认 。 和 否定 这 些 逻 辑 规则 对 你 来 说 也 许 并 不 现实 ， 
然而 逻辑 学 家 的 严谨 迫使 他 们 质疑 这 些 规 则 。 同 样 惊 人 的 是 ， 某 些 被 称 为 直觉 主 
义 者 或 构造 主义 者 的 逻辑 学 家 不 接纳 某 些 特定 的 逻辑 规则 ， 即 使 这 些 规则 对 应 的 
真 值 表 中 的 每 一 格 都 为 真 。 与 之 相对 ， 遵 循 传统 的 逻辑 学 家 有 时 候 又 被 称 为 柏 拉 
图 主义 者 。 

柏拉图 主义 者 和 直觉 主义 者 之 间 的 分 歧 在 他 们 各 自 对 哥 德 尔 不 完备 性 定理 的 
诠释 中 尤为 明显 。 但 要 理解 这 一 点 ， 我 们 必须 绕 个 路 ， 谈 谈 公 理化 方法 。 























































































































公理 化 方法 








要 确定 某 个 长 度 有 限 的 逻辑 公式 的 真 值 ， 我 们 必须 给 出 其 中 布尔 变量 的 真 值 。 
然而 在 谓词 逻辑 中 ， 我 们 可 不 能 花 上 无 限 长 的 时 间 来 列 出 每 个 谓词 的 所 有 可 能 
值 。 所 以 我 们 必须 采用 公理 化 的 手段 ， 换 句 话 说， 与 亚 里 士 多 德 的 三 段 论 一 样 ， 
我 们 要 从 一 些 被 称 为 “公理 ”的 前 提出 发 ， 做 出 逻辑 上 的 推论 。 从 形式 上 来 说 ， 
数学 可 以 归结 为 确定 有 哪些 形 如 “公理 一 定理 ”的 重 言 式 。 

我 们 来 看 看 皮 亚 诺 公 理 这 个 例子 ， 它 是 自然 数理 论 ， 也 就 是 关于 0、1、2、 
3…… 这 些 数 的 理论 基础 。 第 一 个 公理 假设 了 这 个 理论 中 存在 某 个 对 象 ， 我 们 通常 
EIE 0。 第 二 个 公理 大 人 致 说 的 是 所 有 数 都 有 一 个 后 继 者 。 皮 亚 诺 还 提出 了 其 他 
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公理 ， 在 这 里 我 就 不 一 一 叙述 了 P, AMAR, MEARS LEAM, 
我 们 可 以 推导 出 数不胜数 的 数学 定理 。 

然而 ， 皮 亚 诺 公 理 只 在 自然 数理 论 中 有 效 ， 而 大 量 有 趣 的 数学 对 象 并 不 是 整 
数 ， 比 如 说 实数 、 几 何 曲线 甚至 概率 ， 等 等 。 因 此 , 今天 大 部 分 数学 家 更 偏向 于 
RARE - 弗兰克 ( Zermelo-Fraenkel) 公理 ( ZF )， 有 时 还 包括 选择 公理 (C) JL 
乎 所 有 被 证 明 的 数学 定理 可 以 写成 “ZFC 一 某 定理 ”。 

哥 德 尔 不 完备 性 定理 可 以 应 用 到 任何 推广 了 皮 亚 诺 公 理 的 公理 体系 中 。 更 妙 
的 是 ， 它 也 能 应 用 到 所 有 基于 谓词 逻辑 、 公 理 集 合 有 限 (或 者 可 计算 )， 又 能 够 描 
述 自然 数 的 加 法 和 乘法 的 公理 体系 中 "。 所 以 ， 哥 德尔 的 这 个 定理 断言 了 ， 所 有 这 
类 理论 中 都 存在 一 些 公 式 ， 由 公理 出 发 无 法 断定 它们 是 真是 假 外 。ZF 和 ZFC 也 属 
于 这 样 的 理论 。 



































柏拉图 主义 者 对 阵 直 党 主义 者 


柏拉图 主义 的 数学 家 会 将 这 个 定理 解释 成 公理 体系 的 欠缺 。 对 于 柏拉图 主义 
者 来 说 ， 自 然 数 , 或 者 说 自然 数 的 集合 ,实际 存在 于 理念 世界 “之 中 ,而 其 中 的 所 
有 命题 必然 或 真 或 假 。 不 巧 的 是 ， 因 为 语汇 和 符号 都 是 有 限 的， 这 主 我 们 只 能 描 
述 这 个 理念 世界 的 一 部 分 。 所 以 ， 真 理 体 系 的 有 限 性 让 我 们 无 法 证 明 某 些 关于 这 
个 理念 世界 的 正确 定理 。 对 于 柏拉图 主义 者 来 说 ， 哥 德尔 的 定理 证 明了 存在 不 能 
被 证 明 的 正确 定理 。 
直觉 主义 的 数学 家 对 这 个 定理 的 解释 却 不 一 样 。 对 于 直觉 主义 者 来 说 ， 数 学 
就 是 一 种 构造 的 游戏 。 这 样 看 来 ， 皮 亚 诺 的 第 一 条 公理 首先 就 是 一 个 工具 ， 让 我 
们 能 够 构造 数字 0。 而 皮 亚 诺 的 第 二 条 公理 就 像 一 台 机 器 ， 我 们 给 它 一 个 自然 数 ， 
它 就 会 用 这 个 自然 数 构造 一 个 新 的 自然 数 。 

除 此 之 外 ,特别 是 在 类 型 论 这 个 谓词 演算 的 现代 替代 选择 中 ， 直 觉 主义 者 认 










































































中 ”还 有 几 个 技术 上 的 细节 ， 我 们 这 里 就 不 说 了 。 
© 理念 世界 是 柏拉图 主义 中 的 一 个 概念 。 柏 拉 图 主义 区 分 了 三 个 世界 : 意识 身 处 的 内 在 世界 、 
意识 感知 到 的 外 部 世界 、 纯 粹 由 完美 的 概念 构成 的 理念 世界 。 一 一 译 者 注 
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为 “数学 证 明 ” 只 是 这 个 理论 中 的 对 象 ， 所 以 这 些 对 象 自身 也 应 该 是 被 构造 出 来 
的 。 直 觉 主义 者 格外 关注 的 问题 是 这 些 对 象 的 可 构造 性 ， 而 不 是 定理 的 正确 性 。 
对 于 直觉 主义 者 来 说 ， 哥 德尔 的 定理 断言 了 在 所 有 理论 中 都 存在 一 些 定 理 ， 无 论 
是 肯定 还 是 否定 它们 的 证 明 都 不 可 能 被 构造 出 来 。 这 一 点 对 他 们 来 说 不 是 什么 形 
而 上 学 的 难题 ， 因 为 定理 的 正确 性 这 个 问题 只 是 次 要 的 。 
柏拉图 主义 者 与 直觉 主义 者 论战 的 核心 可 以 归结 于 排 中 律 ， 这 个 逻辑 定律 断 
“P 或 非 P” 是 一 个 重 言 式 。 似 乎 只 需要 列 出 真 值 表 就 能 理解 这 一 点 。 如 果 P 是 
HW, IMA “P 或 非 P” 也 是 真 的 ; 如 果 P 是 假 的 ， 那么 “ 非 P” 就 是 真 的 ， 所 以 
"P 或 非 P” 也 是 真 的 。 

然而 ， 对 于 直觉 主义 者 来 说 还 有 第 三 种 可 能 性 : P 既 不 能 被 证 明 ， 也 无 法 被 否 
定 。 这 时 我 们 就 说 P 是 不 可 判定 的 。 这 样 一 来 ， 如 果 了 不 可 判定 ， 那 么 我 们 就 能 
看 到 P HAE P 都 不 是 真 的 ， 所 以 “P 或 非 P” 同 样 不 可 判定 。 的 确 ， 如 果 既 没有 了 
的 证 明 ， 也 没有 非 P 的 证 明 ， 那 么 我 们 就 不 可 能 构造 “P 或 非 P” 的 证 明 。 所 以 ， 
对 于 直觉 主 义 者 来 说 ,“P 或 非 P” 不 是 重 言 式 。 

所 以 ,柏拉图 主义 者 与 直觉 主义 者 之 间 的 对 立 并 不 限于 哥 德 尔 的 定理 。 直 觉 
主义 者 不 接受 柏拉图 主义 者 做 出 的 任何 非 构 造 性 证 明 。 在 用 这 种 方法 证 明 的 定理 
之 中 ,最 有 名 的 有 巴 拿 赫 一 塔 斯 基 悖 论 名、 线性 空间 中 基 的 存在 性 ， 以 及 代数 闭 
包 的 唯一 性 。 
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贝 叶 斯 逻辑 * 














纯粹 贝 叶 斯 主义 者 又 有 什么 看 法 呢 ? 她 相信 哪 种 逻辑 ?经 过 对 贝 叶 斯 主义 的 
思考 ， 我 最 激动 人 心 的 发 现 之 一 就 是 ， 实 际 上 纯粹 贝 叶 斯 主义 者 自己 有 一 套 演绎 
逻辑 ， 它 既 不 是 经 典 逻 辑 ， 也 不 是 直觉 主义 逻辑 。 我 们 可 以 称 之 为 贝 叶 斯 逻辑 ， 
它 是 贝 叶 斯 公式 的 特例 。 在 这 套 逻 辑 中 ， 某 个 事件 ( 比如 令 ) 为 真 ， 对 应 着 这 个 
事件 发 生 的 概率 为 1 的 极端 情况 ， 也 就 是 P[ 令 ]=1。 男 外 ， 事件 邻 丝 涵 男 一 个 事件 
全 可 以 写成 P[ 合 | 售 ]=1， 换 句 话 说 ， 用 贝 叶 斯 主义 的 话 来 说 ， 当 且 仪 当 已 知 令 发 生 
时 全 也 发 生 的 概率 等 于 1 时 ， 才 能 说 令 蕴 涵 个 。 
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与 其 他 逻辑 规则 一 样 ， 肯 定 前 件 推理 和 否定 后 件 推理 也 是 全 概率 公式 和 贝 叶 











斯 公式 的 特例 。 你 可 能 





























还 记得 ， 肯 定 前 件 推理 就 是 “( 合 一 个 ) 且 合 一 个 ”这 个 重 言 














式 。 它 的 贝 叶 斯 版 本 就 是 先 假定 PIPPI 及 P[ 令 ]=1， 从 这 两 个 等 式 出 发 ， 我 们 





可 以 推出 P[T]-1, RE 

















E 议 你 可 以 自己 算 一 算 。 你 也 可 以 试 试用 同样 的 方法 ,利用 





贝 叶 斯 公式 来 证 明和 否定 后 件 推理 、 逆 和 否 命题 的 等 价 性 与 排 中 律 。 





所 以 ， 与 一 般 采 用 
并 不 等 价 于 这 些 经 典 的 


PIPPI 之 间 ， 当 命 为 假 时 二 者 有 着 细微 的 差异 。 这 是 因为 ， 当 命 为 假 时 ， 即 使 











的 逻辑 体系 相 比 ， 贝 叶 斯 逻辑 似乎 毫 不 逊色 。 然 而 ， 它 
逻辑 ， 特 别 是 在 经 典 逻 辑 的 草 涵 关系 合 一 个 和 贝 叶 斯 等 式 




















全 是 假 的 ， 令 一 全 这 个 逻辑 公式 也 为 真 。 你 可 能 觉得 这 样 很 奇怪 ,不 过 这 样 想 的 不 
止 你 一 个 外 1! 然而 ， 如 果 PP, WA PP] 这 个 贝 叶 斯 表达 式 就 没有 定义 。 
有 趣 的 是 ， 与 经 典 逻 辑 相 比 ， 贝 叶 斯 概率 对 蕴涵 关系 的 解释 更 为 自然 。 的 确 ， 




















“如 果 法 国 说 了 2006 年 的 世界 杯 ， 那 么 鸡 就 有 牙齿 ”这 句 话 在 经 典 逻 辑 中 是 正 


























的 ， 然 而 它 似乎 有 些 违背 常识 。 我 们 更 想 说 这 人 句 话 在 逻辑 中 非 真 非 假 ， 或 者 说 它 没 
有 意义 。 这 正 是 贝 叶 斯 逻辑 的 结论 ， 它 断言 当 P[ 令 ]=0 时 ，P[ 个 | 邻 ] 没有 定义 。 
贝 叶 斯 逻辑 也 能 自然 推广 到 谓词 逻辑 的 范畴 ， 但 它 在 那里 还 是 与 经 典 逻 辑 有 
些 区 别 。 要 理解 这 一 差异 ， 就 要 先 把 逻辑 理论 中 的 对 象 看 作 随 机 抽 选 而 来 的 。 我 
们 来 考虑 逻辑 理论 的 对 象 集合 上 的 概率 分 布 。 在 全 称 量化 命题 “vxA(x)” 中 ,如果 




























































































把 x 当 作 根 据 概率 分 布 抽取 的 对 象 ， 那 么 我 们 可 以 把 原来 的 命题 翻译 成 P[A(x)]=1 


这 个 等 式 "。 在 贝 叶 斯 逻辑 中 ， 这 一 等 式 可 以 写成 P[A]=1; 反 过 来 说， 存在 量化 命 
题 “3xA(x)” 可 以 翻译 成 P[A]>0。 























因此 ， 在 贝 叶 斯 逻辑 中 ,全称 量 词 的 特 化 规则 有 它 的 对 应 物 ， 该 对 应 物 可 以 
从 贝 叶 斯 公式 推导 出 来 。 这 样 的 话 , 如 果 P[A]=1, H y 是 理论 中 的 一 个 对 象 ”, 那 








4 P[AG)] - P[Ab»] 1. 
































然而 ， 存 在 量词 在 贝 叶 斯 逻辑 中 的 对 应 物 与 其 在 经 典 逻 辑 























中 的 意义 不 同 。 在 贝 叶 斯 逻辑 中 ， 如 果 P[A]>0， 那 么 我 们 只 能 说 这 个 逻辑 理论 中 





(D 在 测度 论 中 ,我 所 说 的 
(甚至 所 有 对 象 ) WF 


























经 典 逻 辑 和 贝 叶 斯 逻辑 之 间 的 等 价 性 并 不 是 严格 的 ， 因 为 某 些 对 象 
1 的 概率 都 是 0 C 而 且 要 定义 o FORSE MER P). 为 了 简化 问题 ， 在 
































本 书 中 ， 你 可 以 认为 贝 叶 斯 概率 是 定义 在 可 数 的 集合 上 的 ， 概 率 在 每 个 元 素 上 都 非 零 ， 也 就 
是 说 每 个 对 象 x 被 抽 选 到 的 概率 都 严格 大 于 0。 


D 它 被 抽 选 的 概率 不 为 0。 
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存在 一 个 对 象 y， 使 得 A(y) 这 个 事件 发 生 的 概率 严格 大 于 0， 也 就 是 P[A 岂 >0。 


超越 真 与 假 








贝 叶 斯 逻辑 的 神奇 之 处 在 于 ， 它 可 以 让 我 们 超越 经 典 逻 辑 ， 人 允许 我 们 处 理 不 
同 程度 的 确定 性 ， 并 把 它们 组 合 起 来 。 我 们 甚至 可 以 证 明 ， 这 就 是 唯一 一 种 能 做 
到 这 一 点 的 逻辑 "。 这 就 是 杰 恩 斯 - 考 克 斯 定理 及 其 推广 的 结论 叫 ， 它 们 从 某 些 关 
于 可 能 性 逻辑 的 自然 假设 中 推出 了 贝 叶 斯 逻辑 。 

我 甚至 可 以 说 ， 贝 叶 斯 逻辑 让 我 们 可 以 理解 为 什么 这 么 多 逻辑 规则 都 似乎 违 
反 了 直觉 。 要 理解 这 一 点 ， 我 们 可 以 模仿 机 器 学 习 中 的 一 些 算法 ， 比 如 说 我 们 之 
后 会 看 到 的 玻 尔 效 曼 机 ， 它 不 接受 等 于 0 或 1 的 概率 。 毕 竞 在 实践 中 ， 当 我 们 谈 
论 现实 世界 时 ， 最 好 不 要 全 盘 和 否定 任何 东西 。 

这 样 的 话 ， 如 果 说 “如 果 法 国 赢 了 2006 年 的 世界 杯 ， 那 么 鸡 就 有 牙齿 ”这 名 
话 看 起 来 不 对 ， 这 大 概 是 因为 我 们 赋予 “法 国 启 了 2006 年 的 世界 杯 ” 的 概率 并 不 
恰好 为 0。 有 可 能 法 国 球迷 在 决赛 的 时 候 睡 着 了 ， 做 了 个 法 国 落 败 的 趾 梦 ; 又 或 者 
我 们 在 记忆 中 混淆 了 2006 年 世界 杯 和 2000 年 欧洲 杯 的 决赛 (我们 之 后 会 再 谈 到 
记忆 的 脆弱 性 ) ! 谁 又 知道 ， 意 大 利 的 冠军 资格 会 不 会 有 朝 一 日 因为 兴奋 剂 之 类 
的 原因 被 取消 ? 

对 纯粹 贝 叶 斯 主义 者 来 说 ,“ 法 国 在 2006 年 世界 杯 中 落 败 ” 很 有 可 能 是 真 的 ， 
但 我 们 不 能 完全 否定 它 实 际 为 假 的 可 能 性 。 这 样 一 来 ， 如 果 在 法 国 赢得 2006 年 世 
界 杯 的 情况 下 ， 鸡 长 牙齿 的 概率 不 是 1 的 话 ， 那 “如 果 法 国 赢 了 2006 年 的 世界 
WR. 那么 鸡 就 有 牙齿 ”这 和 句 话 就 不 对 了 。 换 句 话 说， 如果 我 们 拒绝 只 有 真 与 假 的 
二 元 逻辑 ， 转 而 借助 置信 度 来 判断 的 话 ， 那 么 这 个 表面 上 的 悖 论 就 不 攻 自 破 了 ! 
无 论 是 在 逻辑 中 还 是 在 政治 中 ， 两 极 分 化 都 会 导致 雇 论 。 

的 确 如 此 。 在 那些 使 我 的 神经 元 大 为 兴奋 的 贝 叶 斯 思想 中 ， 就 有 如 何 解 释 我 
们 在 面 对 逆 否 命题 时 的 不 适 感 。 当 然 ， 当 且 仅 当 某 个 假设 的 道 否 命题 为 真 时 ， 它 



























































































































































中 ”有 时 候 模糊 逻辑 也 被 说 成 候选 理论 之 一 ， 但 模糊 逻辑 中 的 真实 度 对 应 的 并 不 是 概率 (也 就 是 
说 ， 不 对 应 某 种 认 知 的 不 确定 性 )。 
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才 为 真 。 然 而 ， 有 可 能 某 个 假设 正确 的 可 能 性 非常 大 ,但 它 的 逆 否 命题 则 不 然 。 

这 就 是 我 们 在 萨 莉 ， 克 拉克 的 例子 中 看 到 的 现象 。 当 一 位 母亲 无 罪 时 ， 她 的 
孩子 不 太 可 能 会 刚 出 生 就 死亡 。 换 名 话说 ，P[ Eee] 非常 接近 1。 然 而 ， 如 果 孩 
子 刚 出 生 就 去 世 了 ,那么 这 位 母亲 仍然 非常 可 能 是 清白 的 。 换 名 话说 ， 逆 和 否 命题 
的 概率 PEA 接近 0。 我 们 现在 能 解释 为 什么 逆 和 否 命 题 那么 违反 直觉 了 : 在 符合 
命题 逻辑 的 柏拉图 世界 以 外 ， 与 其 将 命题 的 真 与 假 一 分 为 二 ， 更 合理 的 做 法 是 考 
虑 各 种 置信 度 。 这 样 的 话 ， 逆 和 否 命题 的 等 价 性 就 不 再 正确 了 。 

从 真 与 假 的 二 分 法 中 抽身 也 可 以 让 我 们 理解 一 些 被 经 典 逻 辑 视 为 廖 论 的 直觉 。 

假设 会 全， 也 就 是 每 次 下 十 我 都 带 企 ， 那 么 ， 我 们 倾向 于 说 如 果 不 下 十 的 话 ， 我 
带 钙 的 可 能 性 就 更 低 。 这 种 直觉 结论 在 经 典 逻 辑 中 无 法 衡量 ,但 它 是 贝 叶 斯 逻辑 
中 的 定理 。 这 个 定理 断言 ， 如 果 PASS 那么 PIA 非 邻 ] 入 P[ 仿 。 当 然 一 般 来 
说 ， 某 物 存 在 的 证 明 不 存在 ， 不 能 作为 它 不 存在 的 证 明 ， 但 这 种 证 明 的 缺失 只 会 
让 我 们 更 怀疑 它 不 存在 。 
拥抱 贝 叶 斯 逻辑 和 它 带 来 的 不 确定 性 ， 能 让 我 们 透彻 地 理解 黑 乌 鸦 的 神秘 迟 
iE. MK, 用 贝 叶 斯 分 析 可 以 证 明 ， 每 个 红 苹 果 的 确 都 确认 了 乌鸦 是 黑色 的 ,但 这 
种 确认 非常 弱 ， 其 至 极其 微弱 ， 要 比 观察 到 一 只 黑 乌 鸦 带 来 的 确认 弱 得 多 。 这 是 因 
为 不 是 乌鸦 的 事物 在 数量 上 比 乌鸦 多 得 多 。 对 逆 否 命题 的 确认 对 于 原 命题 也 有 效 ， 
但 这 种 效果 是 如 此 微弱 ， 大 体 上 可 以 忽略 不 计 。 黑 乌鸦 悖 论 就 属于 这 种 情况 ! 
个 结论 有 一 个 显然 的 推论 ， 与 每 张 Q 背后 都 是 蓝 色 的 扑克 牌 问题 有 关 : 我 
们 认为 不 能 用 于 否定 问 一 B 这 个 假设 的 两 张 扑 克 牌 ， 其 实 可 以 用 来 佐证 或 质疑 这 
个 假设 的 逆 否 命题 ， 因 此 这 两 张 牧 对 命题 本 身 也 有 效 。 当 然 ， 这样 的 佐证 效力 很 
小 ， 几 乎 可 以 被 忽略 。 

更 一 般 地 说 ,经 典 逻 辑 这 种 真 假 分 明 的 语言 不 适合 用 于 确证 或 否定 某 个 科学 
理论 。 它 忽视 了 确证 的 程度 以 及 否定 的 力度 。 男 外 ， 正 如 埃 利 泽 . 尤 德 科 夫 斯 基 
所 说 ， 对 理论 置信 度 的 贝 叶 斯 计算 并 不 是 一 场 长 征 。 学 习 是 一 支 舞 蹈 。 跟 股票 走 
势 或 地 球 平均 温度 一 样 ， 纯 粹 贝 叶 斯 主义 者 持 有 的 置信 和 度 总 会 随 着 观察 到 的 结果 
而 上 下 浮动 。 在 这 场 学 习 过 程 中 ， 即 使 是 最 优秀 的 理论 ， 它 们 的 置信 和 度 也 不 会 一 
直上 升 ， 而 是 非常 可 能 遭受 多 次 〈 微小 的 ) 损失 ,尤其 是 因为 某 些 观察 结果 偶然 
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会 符合 与 之 竞争 的 理论 。 然 而 ， 长 期 来 说 ， 如 果 某 个 理论 真 的 比 其 竞争 者 更 正确 ， 








那么 它 的 置信 和 度 就 倾向 于 上 升 到 高 位 。 
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不 巧 的 是 ,不 肯 通 融 的 科学 方法 无 法 描绘 这 种 置信 和 度 的 舞蹈 。 最 适合 描述 它 











的 似乎 还 是 纯粹 贝 叶 斯 主义 者 的 概率 语言 。 





矛盾 理论 走向 共存 


纯粹 贝 叶 斯 主义 者 的 那 种 概率 语言 的 男 一 个 优点 ， 





就 是 能 让 我 们 同时 思考 多 


个 理论 ， 更 能 让 我 们 将 它们 各 自 的 预测 组 合 起 来 。 在 机 器 学 习 中 ， 这 个 技巧 被 重 





新 发 气 ， 被 称 为 集成 学 习 (ensembling) 或 者 自助 投票 





( bagging )。 在 实践 中 ， 它 


的 效果 令 人 吃惊 。 将 不 兼容 的 各 种 理论 结合 起 来 似乎 通常 能 给 出 比 最 好 的 理论 更 




















好 的 预测 结果 ! 互 不 兼容 的 模型 组 成 的 森林 要 比 其 中 每 





一 棵 树 更 有 智慧 中。 





我 们 可 以 这 样 描述 这 种 方法 。 纯 粹 贝 叶 斯 主义 者 用 某 个 理论 了 思考 时 ， 得 

















到 的 概率 都 是 关于 7 的 条 件 概 率 。 也 就 是 说 ， 如 果 








在 理论 T 中 ， 我 们 知道 令 








列 涵 合 ， 而 且 合 发 生 的 概率 是 112， 352 p EH Pp? HTIT]-PUTI?H.T]x 


P[ 会 IT]=1x1/2=1/2。 








另外 ， 纯 粹 贝 叶 斯 主义 者 也 能 计算 大 量 不 同 理论 中 的 某 些 概率 。 我 们 回 到 萨 
Tj: 克拉 殉 的 例子 。 纯 粹 贝 叶 斯 主义 者 会 在 她 考虑 的 不 同 理论 了 中 ， 计 算出 两 名 
新 生 儿 出 于 自然 原因 死亡 的 概率 pale H. T], VRBE - 克拉克 无 罪 的 先 验 概率 
PIST] HAA h, HE AI A EJLER, BEA + 克拉 元 无 罪 的 














概率 在 不 同 理论 下 的 结果 PLe |A 7]. 









































如 果 纯 粹 贝 叶 斯 主义 者 被 法 官 质问 ， 要 求 她 提供 唯一 一 个 结果 ， 那 么 她 会 以 
































均 。 从 形式 上 来 说 ， 这 种 加 权 平 均 对 应 的 几乎 ) 就 是 


piela] =} PITIPIS [an 





在 这 里 ,符号 表示 等 式 右面 的 项 是 对 于 各 种 不 同 的 型 
PLAB. 的 项 的 求 和 。 








自己 向 不 同 理论 赋予 的 置信 度 作 为 权重 ， 计 算 通 过 不 同 理论 得 出 的 结果 的 加 权 平 


全 概率 公式 ， 相 当 于 等 式 


T] 





Ee 了 来 说 ， 众 多 形 如 P[T] 
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接 下 来 一 个 自然 的 问题 就 是 : 如 何 计算 P[T] 这 些 概率 ?它们 就 是 纯粹 贝 叶 斯 
主义 者 向 这 些 不 同 理论 赋予 的 置信 和 度 。 要 真正 做 到 加 权 平 均 ， 这 些 概 率 当 然 需 
加 起 来 等 于 1。 

但 更 重要 的 是 ， 这 些 概率 并 不 是 任意 选取 的 。 事 3 
本 书 要 探讨 的 核心 问题 。 通 常 这 些 计算 也 依赖 于 贝 叶 斯 公式 ， 而 这 正 是 第 4 章 的 
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所 有 知识 都 会 转化 为 概率 ， 这 些 概 率 或 大 或 小 ， 
依据 的 是 亲身 经 历 中 自己 的 理解 有 多 正确 或 
者 多 错误 ， 以 及 问题 有 多 简单 或 者 多 复杂 。 
RE RE (1711—1776 ) 
我 们 的 大 脑 有 种 讨厌 的 倾向 ， 认 为 ( 
如 果 在 某 个 假设 下 得 到 的 某 些 结果 发 生 的 可 
能 性 很 小 ， 那 么 假设 本 身 也 极 不 可 能 正确 。 


这 是 错 的 。 


克 里 斯 托 夫 ， 米 歇 尔 (1974 一 


苏格兰 的 黑色 绵羊 


第 4 章 


(正确 地 ) 泛 化 ! 


生物 学 家 、 物 理学 家 和 数学 家 第 一 次 到 苏格兰 旅行 。 他 们 在 驶 往 爱 丁 堡 的 列 





色 的 ! ”物理 











车 上 看 到 了 一 只 及 
学 家 不 耐烦 地 纠正 了 生物 学 家 的 说 法 : “我 们 只 能 说 ， 








及 色 的 绢 羊 。 生 物 学 家 惊 呼 : “难以 置信 ! 苏格兰 的 绢 羊 竟然 是 黑 


苏格兰 至 少 有 一 


只 绵羊 是 黑色 的 。 数学 家 冷静 地 搬 了 一 句 :“ 其 实 我 们 只 能 说 ， 苏 格 兰 至 少 有 一 只 


绵羊 的 一 侧 是 黑色 的 。 

这 个 故事 有 些 可 笑 。 如 果 说 生物 学 家 可 能 
点 太保 守 ， 而 数学 家 的 严谨 实在 夸张 得 可 笑 。 毕 竞 ， 
黑色 的 ,不 将 黑色 外 推 到 绵羊 身体 的 男 一 侧 的 话 ， 也 不 太 合 理 。 





武断 了 ,那么 物理 学 家 大 概 也 有 
如 果 我 们 看 到 绵羊 有 一 侧 是 


男 外 ,我 们 可 以 续 写 这 个 故事 。 假 设 有 位 哲学 家 又 择 了 一 句 话 :“ 但 谁 又 能 说 


清 ， 我 们 是 不 是 真 的 在 苏格兰 ?你 们 可 














所 有 的 回忆 可 能 是 被 恶魔 植 人 的。 









































- 
是 正身 在 床上 做 梦 。 更 糟糕 的 是 ， 你 
信 自己 生活 在 这 个 地 球 上 ,但 实际 上 
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你 只 是 任 由 亚 魔 摆布 ， 让 它 在 你 的 身上 变 戏 法 。 或 者 我 们 也 可 能 只 是 活 在 模拟 之 
中 ,我 们 周围 的 事物 都 不 是 真实 的 ……” 
这 个 笑话 实际 上 揭示 的 就 是 哲学 中 ， 特 别 是 认识 论 中 ， 最 令 人 生 晨 的 问题 


x5 








认识 论 简 史 


在 这 个 问题 上 最 有 影响 力 的 思想 家 可 能 就 是 大 卫 ' PE, fidi 18 世纪 的 苏 格 
兰 哲学 家 。 与 他 同时 期 的 其 他 哲学 家 认为 对 真理 的 证 明 是 必要 的 ， 比 如 笛 卡 儿 就 
声称 自己 利用 “完美 ”这 一 概念 通过 推理 证 明了 上 帝 的 存在 。 他 认为 ， 存 在 比 不 
存在 更 完美 ， 但 上 帝 是 绝对 完美 的 ， 所 以 上 帝 是 存在 的 。 不 幸 的 是 ， 这 种 推理 简 
直 就 是 逻辑 错误 、 公 理化 缺陷 和 动机 性 推理 的 集合 。 

与 此 相对 ， 休 说 在 他 的 巨著 《人 性 论 》 以 及 后 来 的 《人 类 理智 研究 》 里 断言 ， 
仅仅 基于 自身 观察 不 可 能 推出 任何 关于 这 个 世界 的 绝对 且 普 遍 的 规律 。 经 验 论 不 
能 导出 必然 的 真理 。 无 论 做 出 多 少 观察 ， 都 不 可 能 得 出 太阳 每 天 升 起 的 结论 。 即 
使 过 去 的 观察 结果 完全 一 致 ， 人 们 也 不 能 对 未 来 做 出 毫 无 保留 的 预测 。 

然而 ， 休 议 同 样 认为 这 种 推广 通常 相当 正确 ,或 者 至 少 是 有 用 的 。 而 且 对 于 
休 谎 来 说 ,这样 的 推广 通常 正确 的 原因 可 以 归结 于 自然 遵循 着 一 致 性 原则 。 自 然 
规律 似乎 不 会 变化 ， 即 使 有 变化 ， 这 种 变化 也 足够 缓慢 ， 比 如 太阳 中 的 核反应 ， 
让 我 们 能 够 对 不 太 遥 远 的 未 来 做 出 某 些 推论 。 

特别 是 ， 借 助 一 致 性 原则 (之 后 会 用 丘 奇 - 图 灵 论题 来 佐证 )， 我 们 可 以 预测 
可 能 发 生 的 事情 。 休 席 着 重 强调 了 概率 论 在 归纳 问题 的 解决 中 占据 中 心地 位 ， 这 
可 谓 充满 智慧 的 洞察 。 如 果 说 拉 普 拉 斯 是 贝 叶 斯 主义 之 父 ， 那 么 休 席 可 能 算得 上 
是 “祖父 ”一 一 所 罗 门 诺 夫 则 是 那 位 聪明 的 “儿子 ”! 

但 休 议 那 颗 贝 叶 斯 主义 的 种 子 没 有 开花 结果 。 在 他 之 后 两 个 世纪 中 ,人 鲜 有 人 
想到 将 他 的 想法 形式 化 、 数 学 化 。 更 糟糕 的 是 ， 在 1934 年 ， 卡 尔 : 波 普 尔 发 表 了 
《科学 发 现 的 逻辑 》 与 休 议 针锋相对 。 波 普尔 在 这 部 著作 中 描绘 了 他 所 认为 的 科 
学 哲学 。 波 普尔 认为 ， 所 有 科学 理论 首先 都 应 该 拥有 可 以 通过 实验 否定 的 可 能 
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AR 
后 重 
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称 之 为 可 证 伪 性 原则 : 如 果 一 个 理论 能 对 某 些 可 以 设想 的 实验 观察 结果 给 出 
限制 ， 令 它 受 制 于 被 否定 的 可 能 性 ， 那 么 我 们 可 以 说 这 一 理论 是 科学 的 。 然 








复 这 些 实 验 ， 尝 试 明确 否定 对 应 的 科学 理论 





; 或 者 在 无 法 否定 的 情况 下 ， 这 





些 实验 就 算是 这 个 理论 的 佐证 了 。 但 对 于 波 普尔 来 说 ， 优 证 并 不 能 说 明理 论 是 正 


确 的 ! 


! 


行星 研究 简 史 


然而 , 今天 的 科学 哲学 家 通常 不 同意 这 一 点 ， 


认为 波 普尔 的 精巧 原则 并 不 完 





全 符合 科学 研究 的 实际 情况 。 我 们 以 行星 研究 为 例 来 解释 这 一 点 。 
1821 年 ， 天 文学 家 亚 历 克 西 ， 布 瓦 尔 注意 到 天 王 星 的 轨道 有 异常 。 这 颗 太 阳 
第 七 行星 的 运动 似乎 没有 遵循 牛顿 的 万 有 引力 定律 。 天 王 星 似乎 违反 了 牛顿 


系 的 
的 定 


设 太 














律 ， 但 布 瓦尔 并 没有 否定 牛顿 的 这 些 定 律 。 
布 瓦 尔 ， 以 及 紧 随 其 后 的 约翰 ' 库 奇 * 亚当 




















斯 和 于 尔 班 勒 威 耶 更 倾向 于 假 








阳 系 存在 第 八 颗 行 星 。 与 其 听从 波 普尔 的 哲学 ( 波 普 尔 当 时 还 没 出 生 )， 布 瓦 





AK x 


会 说 ， 











亚当 斯 和 勒 威 耶 更 愿意 相信 存在 某 个 未 被 观测 到 的 实体 。 纯 粹 贝 叶 斯 主义 者 














他 们 对 牛顿 理论 的 置信 和 度 大 于 对 第 八 颗 行星 不 存在 的 置信 度 











奇怪 的 是 ， 这 三 位 理论 家 是 对 的 ! 经 过 巧妙 的 计算 ， 亚当斯 和 勒 威 耶 甚至 能 
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定 这 颗 第 八 行星 的 准确 位 置 。 亚 当 斯 请 求 英 





国 剑桥 天 文 台 的 天 文学 家 探测 这 














八 行星 ， 但 艾 里 咒 士 做 的 仅仅 是 质疑 了 亚当 斯 的 计算 。 面 对 兴趣 不 大 的 法 国 





勒 威 耶 在 碰壁 之 后 转 而 联系 德国 柏林 天 文 台 。 

















就 在 同一 天 晚上 ， 约翰: KE 


德 . 加 勒 就 确认 了 勒 威 耶 令 人 目瞪口呆 的 预测 ， 发 现 了 海王 星 ! 

有 人 也 许 会 认为 ， 这 个 故事 的 教训 就 是 绝对 不 要 质疑 牛顿 。 但 科学 史 似 乎 嘉 
欢 将 我 们 搞 得 尝 头 转向 。 还 是 勒 威 耶 ， 在 成 功 预测 到 海王 星 的 存在 之 后 ， 他 又 人 研 
水 星 的 轨道 异常 。 这 些 轨道 异常 令 他 预言 了 太阳 系 第 零 行 星 的 存在 ， 他 将 其 











祝融 星 。 
然而 没 人 观测 到 祝融 星 。 也 许 ， 这 颗 行 星 由 


























于 太 接 近 太 阳 而 探测 不 到 ， 太 阳 


度 掩 盖 了 其 他 光芒 吗 ? 或 者 ， 这 一 次 可 能 真 的 需要 将 牛顿 推 下 神 坛 ? 提出 这 
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个 大 胆 想 法 的 ， 正 是 阿尔 伯 特 ， 爱 因 斯 坦 。 

1915 年 ， 经 历 了 漫长 的 8 年， 经 过 各 种 令 人 生 疑 的 错误 论证 、 菲 不 住 的 计算 
和 灵光 一 内， 爱 因 斯 坦 发 表 了 关于 空间 、 时 间 和 引力 的 革命 性 新 理论 。 这 个 理论 
就 是 广义 相对 论 。 他 的 出 发 点 是 一 个 既 星 涩 又 清晰 的 思想 。 自 1907 年 开始 在 专利 
局 工作 以 来 ， 爱 因 斯 坦 提 出 了 一 个 大 胆 的 想法 ， 这 个 想法 还 引 来 了 我 的 视频 节目 
的 观众 的 嘲笑 : 引力 会 不 会 不 是 一 种 力 ? 引力 会 不 会 只 是 幻觉 ”引力 会 不 会 只 是 
一 种 假象 ， 是 大 地 在 向 上 加 速 运 动 ， 以 及 自我 中 心 主义 将 我 们 限制 在 大 地 这 个 非 
惯性 系 之 中 造成 的 中 ? 

这 种 想法 又 叫 等 效 原理 ， 爱 因 斯 坦 将 它 称 为 他 的 人 生 中 最 愉快 的 想法 中。 但 
这 大 概 不 是 最 令 他 心潮 河 汶 的 想法 。8 年 之 后 ， 爱 因 斯 坦 在 1915 年 建立 了 关于 引 
力 的 新 公式 ， 建 基于 有 关 时 间 与 空间 的 全 新 想法 。( 非 欧 几 里 得 几何 ! ) 特别 是 在 
1915 年 11 月 ， 爱 因 斯 坦 通 过 计算 证 明了 他 那些 神秘 而 无 比 优雅 的 所 谓 时 空 曲率 公 
式 ， 完 美 解释 了 水 星 的 轨道 异常 ! 他 就 此 确信 自己 的 理论 无 误 。 几 个 月 之 后 ， 从 
1916 年 冬天 起 ， 大 数学 家 戴 维 ' 希 尔 伯 特 束 开 始 在 德国 哥 廷 根 大 学 讲述 爱 因 斯 坦 
的 理论 了 GL 

这 里 看 起 来 还 有 一 个 小 小 的 悖 论 等 着 波 普尔 主义 者 。 爱 因 斯 坦 和 希 尔 伯 特 可 
以 称 得 上 当时 最 杰出 的 智者 ， 他 们 怎么 可 能 相信 一 个 未 经 任何 观察 结果 确认 的 理 
ie? 直到 4 年 之 后 ， 观 察 日 食 导 致 的 光线 偏差 的 实验 结果 才 证 实 了 爱 因 斯 坦 的 理 
论 。 一 位 学 生 询 问 爱 因 斯 坦 这 位 德国 智者 ， 如 果 观 察 结果 没有 证 实 他 的 理论 ， 他 
会 怎么 做 。 爱 因 斯 坦 的 回答 是 : “我 会 为 上 帝 感 到 遗憾 。 理 论 是 正确 的 。 

阿尔 伯 特 ' 爱 因 斯 坦 ， 这 位 科学 超级 巨星 对 康德 和 马赫 等 哲学 家 的 工作 有 着 
浓厚 的 兴趣 ， 而 他 并 没有 接受 通过 实验 来 证 伪 的 想法 。 爱 因 斯 坦 似 乎 并 没有 遵循 


波 普尔 的 哲学 。 









































































































































































































































科学 与 波 普 尔 背道而驰 ? 


反映 波 普尔 哲学 不 足 之 处 的 例子 远 远 不 止 我 刚刚 给 出 的 这 些 。 只 要 稍 加 留心 
科学 史 的 细节 ， 你 就 能 明白 波 普尔 的 方法 论 并 非常 规 。 从 巴 斯 德 的 生源 说 到 达尔 
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文 的 演化 论 ， 从 艾 萨 克 ， 牛顿 的 《自然 哲学 的 数学 原理 》 到 门 捷 列 夫 的 元 素 周 期 


表 ， 从 量子 力学 到 弱 理 论 ， 





这 些 理论 的 发 明 者 似乎 在 按照 波 普尔 的 要 求 花 时 间 测 





试 这 些 理论 之 前 ， 就 早已 而 





信 他 们 的 理论 是 正确 的 。 

















新 近 的 例子 之 一 是 超 光 速 中 微 子 事 件 。2011 年 ，OPERA 实验 团队 宣称 发 现 了 
超 光 速 中 微 子 ， 然 而 这 种 中 微 子 的 存在 违背 了 狭义 相对 论 的 基础 。 几 乎 所 有 物理 
学 家 对 这 个 基础 的 置信 度 都 非常 高 ， 以 至 于 他 们 更 倾向 于 认为 实验 测量 出 了 错 。 








在 著作 《大 图 景 》 中 ， 











物理 学 家 肖 恩 : 卡 罗 尔 不 无 幽默 地 指出 ， 这 就 是 实验 


[s 


被 理论 否定 的 众多 例子 之 一 。 这 可 能 有 点 自 相 矛 盾 ， 其 至 与 科学 方法 完全 对 立 。 
的 确 如 此 ， 但 正如 我 们 将 在 下 一 章 看 到 的 那样 ， 对 于 纯粹 贝 叶 斯 主义 者 来 说 ， 物 








理学 家 的 想法 实际 上 完全 合理 。 


























波 普尔 自己 也 意识 到 他 的 哲学 并 不 能 在 严格 的 意义 上 被 应 用 到 科学 中 。 毕 竞 











所 有 实验 结果 都 受制 于 测量 误差 与 随机 因素 ， 这 都 会 让 实验 的 结果 至 少 带 有 一 点 
随机 性 。 所 以 ,我 们 必须 改造 波 普 尔 的 哲学 ， 以 合理 考虑 科学 实验 中 国有 的 统计 








误差 o 


频率 主义 > 

















统计 误差 理论 的 主角 是 卡尔 . RARE, IR ' 皮尔 逊 (前 者 的 儿子 入 HÉ 











日 . 内 曼 ， 尤 其 是 罗 纳 德 ， 


套 名 为 频率 主义 的 思想 框架 ， 到 今天 ， 该 框架 已 经 进驻 了 所 有 科学 学 科 。 频 率 主 
义 假设 概率 就 是 对 频率 的 测量 。 对 于 频率 主义 者 来 说 ， 要 理解 概率 ， 首 先 要 理解 





当 样 本 数量 变 得 足够 大 时 ， 





费 希 尔 。 在 1920 年 前 后 ， 这 些 天 才 统 计 学 家 建立 了 一 
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误差 是 如 何 消 失 的 。 





一 如 波 普 尔 的 上 哲学， 频率 主义 者 那 诱 人 的 想法 首先 在 于 方法 的 客观 性 。 皮 尔 
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ib. MA RAENT 48 Hh BR JE RETRO SAIS DU ET RE , 
还 能 应 用 于 所 有 问题 。 与 频率 主义 者 贬低 的 贝 叶 斯 方法 不 同 ， 频 率 主义 方法 不 允 
午 相信 不 同 理论 的 人 借助 有 问题 的 先 验 概率 来 丕 曲 实 验 结论 。 


























频率 主义 哲学 的 核心 内 容 之 一 ， 就 是 利用 p 值 进行 统计 检验 的 概念 。 统 计 检 
验 就 是 对 某 个 理论 了 的 可 信 度 的 测试 。 对 于 频率 主义 者 来 说 ， 他 们 对 可 信 度 做 出 
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某 种 预先 假定 。" 与 波 普尔 的 哲学 相符 的 是 ， 统 计 检验 接 下 来 就 会 尝试 通过 实验 来 
和 否定 理论 了 的 可 信和 度 。 我 们 把 实验 中 收集 到 的 数据 称 为 4。 如 果 数 据 a 非常 不 可 能 
在 理论 了 中 出 现 ， 那 么 频率 主义 者 就 会 提议 否定 7。 

实际 上 ， 如 果 我 们 尝试 将 这 种 推理 翻译 成 更 数学 的 说 法 ， 那 么 我 们 会 发 现 这 
种 方法 有 一 个 关于 量 级 的 缺陷 : 如 果 我 们 考虑 非常 精确 的 数据 ， 那 么 这 些 数据 都 
极 不 可 能 出 现 。 确 实 ， 如 果 我 得 到 了 d=0.158 319 741 2+10-0， 但 我 的 理论 指出 ， 
得 到 的 数值 应 该 处 于 0 和 1 之 间 ， 那 么 得 到 4 这 个 确定 到 小 数 点 后 10 位 的 数值 的 
可 能 性 就 是 五 十 亿 分 之 一 。 所 以 我 们 应 该 否定 这 个 理论 。 

为 了 使 方法 更 合理 ， 频 率 主义 者 提出 ， 对 于 所 有 数据 4， 都 应 该 考虑 理论 T 
中 比 它 “ 更 不 可 能 出 现 ” 的 数据 集合 D。 比 如 说 ， 如 果 理 论 7 了 指出 我 们 应 该 得 到 
的 数据 是 40， 但 我 们 得 到 的 数据 d 却 严格 大 于 0， 那么 “ 比 d 更 糟糕 的 集合 D" 
一 般 就 是 比 4 还 要 大 的 所 有 数值 的 集合 ， 或 者 说 是 与 0 的 距离 比 4 还 要 大 的 数据 
的 集合 。 

MI AES p 值 与 我 们 考虑 的 理论 T. Zi d 与 统计 检验 相关 ， 它 的 定义 就 是 
得 到 比 4 更 糟糕 的 数据 D 的 可 能 性 。 换 句 话 说， 我 们 可 以 写 出 以 下 公式 : 

p= P[DtEasE25|T| 













































































我 们 如 果 将 它 与 贝 叶 斯 公式 比较 ， 就 能 看 到 p 值 与 我 们 在 第 2 章 谈 到 的 思想 实验 
项 很 相似 ， 它 测量 的 是 理论 7 在 什么 程度 上 能 够 “很 好 地 ”解释 观察 结果 。 

从 直觉 上 来 说 , p 值 越 小 ， 数 据 a 似乎 就 与 理论 了 越 不 兼容 ， 而 我 们 就 更 倾向 
于 否定 理论 7。 费 希 尔 提 出 应 该 否定 那些 p 值 小 于 5% 的 理论 。 在 今天 ， 由 于 新 技 
术 让 我 们 能 够 搜集 十 亿 量 级 的 数据 ， 在 某 些 物理 实验 中 ， 数 据 甚 至 能 达到 千 万 亿 
量 级 ， 这 时 我 们 一 般 采 用 0.000 03% 作为 阔 值 。 

无 论 细节 如 何 ， 不 可 否认 的 是 ， 费 希 尔 的 原则 在 20 世纪 下 半 叶 带 来 了 令 人 难 
以 置信 的 丰硕 成 果 。 比 如 说 在 2012 年 ， 欧 洲 核子 研究 组 织 ( 以 下 简称 CERN ) 就 
宣布 大 型 强 子 对 撞 机 探测 到 了 和 硕 格 斯 玻 色 子 。 实 际 上 ， 如 果 要 歇 毛 求 症 ， 那 么 应 
该 说 CERN 证 明了 ,假设 粒子 物理 学 标准 模型 中 的 希 格 斯 玻 色 子 不 存在 的 话 ， 他 

























































































(D 贝 叶 斯 主义 者 会 抬杠 说 这 就 是 主观 的 先 验 概率 ! 
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们 就 极 不 可 能 观察 到 当前 的 观察 结果 。 也 就 是 说 ， 在 希 格 斯 玻 色 子 不 存在 的 假设 
中 ,得 到 CERN 的 (或 者 比 其 更 不 可 能 的 ) 观察 数据 的 概率 要 低 于 0.000 03%。 这 
让 CERN 的 研究 者 否定 了 希 格 斯 玻 色 子 不 存在 的 可 能 性 ,或 者 就 像 媒 体 所 说 ， 他 
们 就 此 接受 了 希 格 斯 玻 色 子 的 存在 性 外。 

频率 主义 者 的 方法 统治 了 20 世纪 的 科学 ， 毫 无 敌手 。 特 别 是 费 希 尔 对 此 非常 
































投入 ， 他 对 贝 叶 斯 公式 发 起 尖锐 批评 ， 而 且 为 了 封锁 所 有 反对 其 天 才 想 法 的 意见 











采用 了 毒 辣 而 项 固 的 手段 ， 让 所 有 本 想 与 他 的 频率 主义 哲学 一 争 长 短 的 理论 都 变 


成 了 禁忌 。 他 这 样 断言 : 














“ 逆 概 率 理论 ( 也 就 是 贝 叶 斯 定理 ) 建 基于 一 个 错误 ， 应 





该 被 完全 和 否定。” 如 果 要 把 统计 学 的 历史 写成 摩 尼 教 式 的 小 说 “, 把 纯粹 贝 叶 斯 主义 
者 看 作 小 说 的 主角 ,那么 费 希 尔 和 其 他 所 有 频率 主义 者 就 是 黑 恶 势力 。 
话 虽 如 此 ,但 抛 开 他 的 做 慢 、 神 经 质 和 成 视 他 人 的 性 格 ， 以 及 他 对 优生 学 和 


种 族 主义 的 坚信 不 谈 ， 











费 希 尔 仍然 是 一 位 杰出 的 数学 家 ， 也 是 20 世纪 最 有 影响 力 


的 思想 者 之 一 。 正 因为 他 的 严谨 和 才华 ，20 世纪 的 科学 ， 特 别 是 所 谓 的 软 科 学 取 
得 了 长 足 的 进展 ， 其 可 信和 度 也 大 大 提高 。 费 希 尔 的 统计 学 带 来 了 巨大 的 好 处 。 


尽管 如 此 ， 纯 粹 贝 叶 


对 她 来 说 没 头 没 尾 。 





更 有 前 途 ? 难道 不 应 


























斯 主义 者 提出 了 许多 反对 意见 。 实 际 上 ， 频 率 主 义 方法 





为 什么 要 接受 这 种 对 可 信和 度 的 假设 ?为 什么 要 预先 假设 所 有 
理论 都 有 检验 的 价值 ? 难道 那些 更 简单 或 者 结构 更 分 明 的 理论 就 不 能 比 其 他 理论 


hy TA [B] 











考虑 某 个 理论 过 往 的 成 就 ”为 什么 要 考虑 那些 比 d 更 























糟糕 的 数据 ?” 是 不 是 必定 存在 一 种 自然 的 方法 来 确定 比 4 更 糟糕 的 数据 的 集合 ? 


为 什么 对 某 个 理论 的 否定 是 决定 性 的 ?如 果 我 们 否定 了 所 有 理论 ， 那 应 该 怎么 
Jp? 我 们 不 是 更 应 该 对 这 些 不 同 的 理论 进行 比较 吗 ” 为 什么 要 把 阔 值 定 为 5% ? 
0.000 03% 的 阔 值 又 是 怎么 来 的 ? 这 些 数值 难道 不 是 完全 随意 确定 的 吗 ? 如 果 只 有 








很 少 的 数据 ， 我 们 色 


谈论 生命 ? 宇宙 也 只 


出 什么 结论 ? 在 只 知道 地 球 上 有 生命 的 情况 下 ， 应 该 怎样 


一 个 ， 








CD 摩 尼 教 的 主要 教义 是 光明 与 黑暗 的 对 峙 。 一 一 译 者 注 

















这 又 该 怎么 办 ? 如 何 处 理 苏格兰 黑色 绵羊 这 个 例子 ? 
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反对 p 值 的 统计 学 家 














并 不 是 只 有 纯粹 贝 叶 斯 主义 者 在 攻击 波 普尔 和 频率 主义 者 。 最 近 , p 值 在 统计 
学 家 中 也 风 评 其 差 。 这 种 恶 评 的 原因 之 一 就 是 只 有 得 出 结论 的 结果 才能 发 表 而 导 
致 的 选择 偏差 。 更 糟糕 的 是 ， 人 们 越 来 越 常 使 用 所 谓 的 p 值 操控 的 策略 ， 我 们 之 
后 会 再 谈 到 这 一 点 。 无 论 出 于 什么 原因 ， 在 已 发 表 的 论文 中 ， 错 误 泛 滥 成 灾 ， 瓦 
伦 : 约翰 逊 估 计 至 少 25% 的 论文 有 问题 。 

实际 上 ， 科 学 结论 中 出 现 的 错误 肯定 要 比 这 个 估计 值 多 得 多 ， 特 别 是 在 同样 考 
上 处 那 些 无 关 统计 学 的 错误 时 。 计 算 机 科学 家 莱 斯 利 * 兰 波 特 甚至 提出 ， 即 使 是 通过 评 
审 委员 会 的 评审 后 发 布 的 数学 论文 ， 三 篇 中 也 有 一 篇 至 少 包含 一 个 错误 的 定理 01 | 

更 惊人 的 是 ， 如 果 认 真 考 虑 p 值 的 话 ， 那 么 我 们 最 终 就 必然 否定 所 有 科学 理 
论 ， 包 括 那 些 正确 的 理论 。 的 确 ， 如 果 相 信 大 部 分 科学 方法 的 描述 的 话 ， 所 有 理 
论 都 应 该 接受 一 次 又 一 次 的 测试 。 然 而 ， 如 果 阔 值 设 为 0.000 03%， 那 么 每 次 实验 
都 有 0.000 03% 的 概率 否定 它 测 试 的 正确 理论 。 实 际 上 显然 的 是 ， 如 果 我 们 的 科 
学 理论 仍然 屹立 不 倒 ， 那 只 是 因为 它 还 没有 被 充分 测试 过 。 但 如 果 我 们 不 停 测试 
这 些 理论 ,那么 终 有 一 天 会 迎 来 对 它们 的 和 否 证 ， 在 劫难 逃 。 这 不 是 很 奇怪 吗 ? 科 
学 方法 必然 会 否定 所 有 正确 的 理论 了”! 随 着 时 间 流 逝 , 统计 学 家 对 此 变 得 越 来 越 激 
进 。 在 2010 4E, 1518 + 西 格 弗 里 德 解释 了 他 为 什么 不 信任 科学 论文 ， 他 断言 :“ 这 
就 是 科学 中 最 黑暗 却 又 无 人 承认 的 秘密 : 通过 统计 分 析 来 检验 假设 的 所 谓 “ 科 学 
方法 "， 竞 然 建立 在 如 此 薄弱 的 根基 上 。” 在 2014 年 ， 雷 吉 娜 ， 努 佐 也 说 :“ 问题 ) 
来 自己 值 那 具 有 惊人 欺骗 性 的 本 质 ， 它 没有 大 部 分 科学 家 认为 的 那么 可 靠 、 客 观 。 

众多 统计 学 家 建立 在 统计 学 基础 上 的 激烈 批评 在 2016 年 达到 高 峰 ， 汇 聚 成 了 
美国 统计 学 会 的 一 份 公告 四 :“ 统 计 学 家 集体 对 科学 结论 的 可 再 现 性 与 可 重复 性 感 
到 非常 忧心 。 我 们 在 这 里 不 深入 这 些 术 语 的 定义 和 区 分 ， 但 我 们 观察 到 ， 出 现 了 
大 量 对 科学 有 效 性 的 困惑 甚至 疑虑 。 这 样 的 疑虑 可 能 会 导致 激进 的 决定 ， 比 如 说 
《基础 与 应 用 社会 心理 学 》 的 编辑 就 决定 禁止 使 用 p fs Corn ) 对 统计 推断 的 误 
























































































































































































































































(OD ”如果 阅 值 是 5%， 那 么 大 约 ( 仅 需 ! ) 20 次 实验 就 能 否定 某 个 正确 的 理论 。 如 果 阔 值 是 1%, 
那 就 需要 大 约 100 次 实验 。 
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解 与 误 用 只 是 “可 重复 性 危机 ”的 原因 之 一 ， 但 对 于 我 们 这 个 群体 而 言 ， 这 是 一 


个 重要 原因 。” 


p 值 操 控 





当然 ， 有 人 对 p 值 的 理解 并 不 充分 但 也 有 人 对 它 的 理解 过 于 充分 ， 从 中 看 
到 了 在 “不 发 表 就 完蛋 ”( publish or perish) 的 信条 统治 学 术 界 的 时 代 里 ， 助 推 自 





己 职业 生涯 的 机 会 。 然 而 ， 要 发 表 论文 ,外 
XABIEN p 值 。 不 正确 的 理论 不 太 可 能 得 到 这 样 的 p 值 ， 但 可 能 性 也 没 那 么 低 。 








主 往 必 须 〈 或 者 说 只 需要 ) 获得 小 于 5% 














如 果 我 们 希望 否定 某 个 正确 的 理论 ,根据 jp 值 的 定义 ， 获 得 这 样 的 p 值 的 概率 实 
际 上 就 是 5%。 也 就 是 说 ,平均 每 20 次 实验 中 就 有 一 次 能 得 到 可 以 发 表 的 疡 值 ! 
换 名 话说， 只 要 多 做 实验 ， 就 能 得 到 有 资格 在 科学 期 刊 上 发 表 的 结果 。 这 就 是 所 





WA p 值 操控 。 
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兰 道 尔 : 门 罗 的 漫画 《显著 》 就 绝妙 地 描绘 了 p 值 操控 的 危害 。 门 罗 想 象 有 





人 怀疑 某 种 糖 豆 会 引发 青春 癌 ， 科 学 家 对 此 进行 了 实验 ,得 到 的 结论 是 “ 糖 豆 不 
会 引发 青春 癌 ” 这 个 理论 7 对 应 的 p 值 大 于 5%。 也 就 是 说 ， 实 验 无 法 否定 理论 
7。 到 这 里 一 切 都 还 好 。 

但 又 有 男 一 个 流言 说 ， 实 际 上 只 有 某 种 颜色 的 糖 豆 会 引发 青春 癌 ， 但 糖 豆 一 


共有 20 种 颜色 ， 











所 以 需要 进行 20 个 独立 的 实验 。 不 出 意外 ， 其 中 一 个 实验 得 出 





了 小 于 5% 的 p 值 。 这 就 是 以 否定 “绿色 糖 豆 不 会 引发 青春 癌 ” 这 个 假设 。 第 二 
天 的 报纸 上 就 头条 登载 一 一 科学 证 明 绿色 糖 豆 会 引发 青春 痘 ! 
从 全 世界 的 科学 实践 层面 上 来 说 ， 独 立 实验 的 数量 远 远 大 于 20， 所 以 那些 唯 


恐 天 下 不 乱 的 报 
部 分 最 后 会 被 其 人 

















刊 总 能 找到 数 以 千 计 的 令 人 震惊 的 科研 论文 来 报道 。 这 些 论文 大 





也 论文 否定 ， 其 至 被 作者 撤回 ， 这 也 不 奇怪 。 


除了 重复 实验 以 外 ,还 有 一 种 方法 能 同样 有 效 地 得 到 可 发 表 的 结果 : 只 需 不 
断 积累 实验 数据 ， 直 到 足以 得 出 想 要 的 结论 。 奇 怪 的 是 ， 人 们 已 经 证 明了 ， 只 要 
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不 断 积累 实验 数据 "， 直 到 能 够 得 出 能 和 否定 这 个 理论 的 结果 ， 我 们 就 可 以 用 疡 值 否 
定 任何 理论 。 也 可 以 说 ， 如 果 你 的 数据 还 不 足以 否定 要 检验 的 理论 ， 只 要 继续 收 
集 更 多 数据 ， 你 最 终 总 可 以 否定 它 。 

你 看 到 问题 了 吗 ? 一 旦 选择 好 什么 时 候 停止 实验 ， 我 们 就 引入 了 巨大 的 选择 
偏差 。 如 果 你 的 论文 没有 说 明 如 何 确定 采集 数据 的 数量 ,那么 其 他 人 就 无 法 指责 
这 一 点 ， 除 非 这 个 方法 可 以 被 逆 推 出 来 。 这 样 ， 你 的 论文 就 符合 p 值 “ 科 学 方法 ” 
的 规范 。 然 而 不 幸 的 是 ， 持 续 采 集 数 据 ， 直 到 得 到 能 证 明 结 论 的 统计 结果 ， 这 种 
做 法 非常 普遍 E 

有 人 就 此 提出 要 降低 疡 值 的 阔 值 ， 但 即使 是 在 阔 值 取 到 极端 的 0.000 03% 的 
物理 学 中 ， 问 题 仍然 存在 。 统 计 分 析 造 成 的 假象 和 重复 实验 ， 导 致 了 2003 EES 
克 态 的 “发 现 ”， 其 他 独立 实验 通过 摆弄 数据 也 验证 了 这 个 “发 现 ”， 但 最 后 科学 
共同 体 还 是 否定 了 它 ， 因 为 原始 实验 的 结果 无 法 重复 “。 使 用 p 值 的 “科学 方法 ” 
中 的 随机 性 令 人 们 认真 地 质疑 起 科学 结论 的 可 靠 性 。 如 果 你 想 要 知道 更 多 信息 ， 
我 只 能 向 你 推荐 两 个 关于 这 场 争论 的 简 述 : 博客 Science Étonnante 中 的 一 篇 文章 VI 
和 Veritasium 的 视频 四 。 













































































统计 学 课本 讲 了 什么 








我 们 来 看 看 现代 著名 统计 学 课程 的 教材 ， 里 边 有 些 有 趣 的 东西 。 统 计 学 家 拉 
里 . 沃 瑟 曼 在 他 的 教材 里 写 道 : "观察 研究 的 结果 只 有 当 以 下 条 件 都 满足 时 才 开 始 
变 得 可 信 : (一 ) 结果 在 数 个 研究 中 被 重复 ,( 二 ) 每 个 研究 都 控制 了 可 能 的 混杂 因 
素 ,( 三 ) 因果 联系 的 存在 有 一 个 言 之 有 理 的 科学 解释 。” 

我 们 之 后 会 谈 到 混杂 因素 ,现在 你 只 需要 知道 它 给 p 值 的 缺陷 又 加 上 了 一 重 
SARERA, 


























中 然而， 能 否定 某 个 假设 所 需 的 数据 量 一 般 来 说 呈 指 数 增长 。 话 虽 如 此 ， 乔 哈里 、 派 莱 基 斯 和 
沃 尔 什 证 明了 ， 上 额外 数据 只 需要 达到 菜 个 合理 的 量 级 ， 和 否定 假设 的 概率 就 会 大 幅 增长 。 

D 乔 哈里 和 合作 者 提出 了 疡 值 的 一 种 变 体 来 弥补 这 一 点 。 

© 五 夸克 态 在 2015 年 似乎 最 终 真正 被 发 现 了 。 












































JA Es S] — PEINE EE 
模糊 的 词语 组 成 ， 比 如 
“因果 联系 ” 


解释 ” 


。“ 可 信 ” 
请 注意 


强调 在 解释 统计 数据 时 需要 谨慎 。 
然 

人 们 就 很 可 能 

好 处 、 





























希 格 

















斯 玻 色 子 的 存在 时 ， 或 者 说 他 毫 不 怀疑 这 个 宇 





是 有 种 不 舒服 的 感 党 。 我 们 的 纯粹 贝 叶 苏 


F 始 变 得 可 信 ” 











第 4 章 DA 


“ 数 个 研究 ”“ 可 外 

















iF， 这 种 艺术 式 的 模糊 也 给 科学 带 来 了 不 干 不 脆 的 印象 。 如 果 过 
认为 任何 事物 都 无 法 摆脱 所 有 合理 怀疑 ， 这 
全 球 气候 变 暖 以 及 烟草 对 健康 的 危害 。 
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的 描述 中 那 种 艺术 式 的 模糊 。 上 文中 的 引 语 由 大 量 
E” AZA “PH 
， 等 等 。 这 是 有 意 而 为 的 ， 而 且 这 些 词 语 的 意义 依赖 于 如 何 解 
这 个 词 似乎 甚至 在 邀请 我 们 投入 贝 叶 
意 ， 我 这 样 说 不 是 为 了 批评 拉 里 : 








斯 主义 的 怀抱 ! 
天 蕊 曼 或 者 他 的 教材 。 他 的 教材 非常 
HE. KRE, 似乎 所 有 频率 主义 的 优秀 教材 都 强调 了 这 种 艺术 式 的 模糊 ， 而 且 

















FE, 


会 让 某 些 人 怀疑 疫苗 的 
就 算是 我 ， 当 某 位 科学 家 说 证 明了 
































有 主义 者 也 是 这 样 。 





雷 遵 循 量子 力学 的 时 候 ， 我 还 


我 们 需要 一 种 更 合适 的 语言 来 描述 我 们 说 出 的 各 种 断言 的 程度 各 异 的 确定 






























































“ 言 之 成 理 ”“ 可 


EE 怀疑"”。 描 述 这 些 置 信和 度 更 严谨 的 方法 必然 是 某 种 

















所 有 知识 哲学 都 可 以 归结 为 计算 贝 叶 斯 置信 度 。 
。 有 一 个 神奇 的 公式 可 以 做 到 这 一 点 ， 





它 最 基本 的 形式 ， 我 们 真 的 可 以 把 它 叫 作 智 





























性 或 置信 和 度 。 这 种 语言 的 初步 版 本 ， 或 者 说 简化 版 本 ， 就 是 
信 ”“ 高 度 可 能 ”和 “超越 合 型 
类 似 (甚至 同 构 ) 于 贝 叶 斯 概率 的 语言 。 
智慧 方程 

对 于 纯粹 贝 叶 斯 主义 者 来 说 ， 
知识 ， 就 是 对 不 同 的 理论 赋予 合适 的 置信 度 
对 ， 我 说 的 就 是 贝 叶 斯 公式 ， 特 别 
莫 方 程 ， 我 认为 它 就 是 下 面 这 个 美妙 的 公式 : 

P[T|D] = e 
T], P[D|4JP[A] 


在 这 里 , 7 表示 我 们 考虑 的 理论 ，D 表示 已 知 的 数据 ， 
论 。 为 了 更 习惯 这 个 公式 ， 














你 可 以 重读 一 下 第 2 章 。 





i 4 代表 所 有 了 的 替代 理 
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我 只 能 请 你 多 花 时 间 ， 一 而 再 、 再 而 三 认真 思考 这 个 无 比重 要 的 公式 。 也 请 
你 想象 一 下 ， 纯 粹 贝 叶 斯 主义 者 会 怎么 利用 这 个 公式 回答 她 在 面 对 波 普尔 哲学 时 
提出 的 问题 。 

首先 , p 值 在 这 里 对 应 的 是 思想 实验 项 P[D| 直 。 这 一 项 至 关 重 要 ， 它 衡量 的 
是 理论 预测 观察 数据 的 能 力 。 然 而 ， 对 于 纯粹 贝 叶 斯 主义 者 来 说 ， 这 只 是 公式 的 
一 部 分 。 

男 一 个 有 着 根本 性 意义 的 项 就 是 先 验 概率 P[ 直 。 这 一 项 我 们 无 法 回避 。 我 们 
将 会 在 之 后 的 章节 中 看 到 ， 这 个 先 验 概率 让 我 们 在 日 常生 活 中 即使 只 能 接触 到 极 少 
的 样本 也 能 学 习 。 更 妙 的 是 ， 我 们 还 会 看 到 在 结合 理论 计算 机 科学 之 后 ， 贝 叶 斯 主 
义 的 先 验 概率 就 殖 含 了 奥 卡 姆 剃刀 法 则 ， 这 个 哲学 原则 断言 越 简 单 的 理论 越 可 信 。 

但 最 重要 的 是 ， 公 式 中 的 分 母 叫 作 配 分 函数 。 这 个 分 母 等 于 P[D]， 我们 只 是 
利用 全 概率 公式 对 它 进行 了 分 解 。 这 个 分 母 的 一 部 分 就 是 分 子 本 对 ,但 配 分 函数 
还 包含 关于 替代 理论 的 类 似 项 。 也 就 是 说 ， 这 个 配 分 函数 让 不 同 的 理论 可 以 相互 
竞争 ， 就 此 保证 置信 度 的 和 总 是 等 于 1。 

当 且 仅 当 某 个 理论 比 对 手 可 靠 得 多 的 时 候 ， 纯 粹 贝 叶 斯 主义 者 才 会 向 这 个 理 
论 赋 予 相当 高 的 置信 度 。 意 思 就 是 ， 纯 粹 贝 叶 斯 主义 者 不 会 仅仅 因为 某 个 理论 可 
以 解释 某 些 容易 解释 的 现象 ， 就 给 这 个 理论 赋予 很 高 的 置信 度 ， 在 其 他 更 简单 的 
理论 也 能 做 出 同样 好 甚至 更 好 的 解释 时 更 是 如 此 。 反 过 来 说 ， 对 于 某 些 难以 解释 
的 现象 ， 从 纯粹 贝 叶 斯 主义 者 那里 赢得 最 多 置信 度 的 理论 不 一 定 能 完美 解释 这 些 
现象 ， 尤其 是 ， 在 其 他 理论 根本 无 法 解释 同样 的 现象 时 更 是 如 此 。 

另 一 件 需要 强调 的 事情 ， 就 是 所 谓 的 “观察 数据 ”是 什么 。 这 个 变量 代表 的 
不 是 某 个 科学 实验 的 所 有 结果 ， 而 是 纯粹 贝 叶 斯 主义 者 在 一 生 中 可 以 得 到 的 所 有 
数据 。 尤 其 是 ， 这 意味 着 不 能 孤立 地 看 待 任何 实验 。 

另外 ， 尽 管 科 学 家 用 到 了 频率 主义 者 的 统计 流程 ， 但 他 们 的 思考 基础 更 倾向 
于 累积 数据 的 贝 叶 斯 哲学 ， 而 不 是 带 有 暗示 性 的 所 谓 “ 科 学 方法 "。 正 因 如 此 ， 研 
究 论 文 的 开头 都 是 一 大 段 对 过 往 文献 的 概述 ， 用 于 证 明 这 篇 论文 的 贡献 属于 某 个 
更 广阔 的 研究 领域 。 正 如 我 们 将 在 第 5 章 看 到 的 那样 ， 科 学 家 似乎 更 倾向 于 按照 
贝 叶 斯 主义 的 原则 而 不 是 波 普 尔 的 哲学 来 思考 。 
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渐进 学 习 








在 实践 中 ， 人 们 并 不 会 回忆 一 生 中 收集 到 的 所 有 数据 来 确定 某 个 理论 的 置信 
度 一 一 更 何况 ， 我 们 有 限 的 记忆 不 足以 做 到 这 一 点 ， 我 们 之 后 会 再 探讨 这 个 问题 。 
我 们 更 倾向 于 以 渐进 的 形式 来 学 习 。 当 然 ， 贝 叶 斯 公式 也 恰好 能 让 我 们 整合 收集 
到 的 新 数据 ( ND )， 以 此 细 化 置信 和 度 。 这 个 过 程 对 应 着 所 谓 的 “ 贝 叶 斯 推断 ”。 
种 推断 方式 ,或 者 说 更 新 置信 度 的 方式 的 基础 就 是 以 下 这 个 贝 叶 斯 公式 的 部 分 
展开 : 
























































PIND|T H.D]PP[T|D] 


H = 
C PINDITE D]P[T|D]--?P(ND|4 H. D]P[A|D] 























为 了 简明 起 见 ， 这 里 将 理论 记 作 7， 替 代理 论 记 作 4， 旧 数据 记 作 DD， 而 新 数据 记 
VE ND。 特 别 有 趣 的 是 获得 新 数据 ND 的 方式 与 旧 数 据 D 完全 独立 的 情况 ， 在 这 种 
情况 下 “我们 会 得 到 下 面 的 贝 叶 斯 推断 公式 : 














PINDIT]PITID] 


PITINDE D] = 
P[ND|T]P|T|D]4- Y P[ND|4 | PLA |D] 














这 个 公式 与 我 们 之 前 看 到 的 贝 叶 斯 公式 几乎 一 致 ， 除 了 这 里 的 先 验 概率 是 利 
用 在 收集 新 数据 ND 之 前 得 到 的 旧 数 据 D 计算 出 来 的 。 换 句 话 说 ， 在 实践 中 获得 
新 数据 的 那 一 刹那 ， 实 用 贝 叶 斯 主义 者 就 会 将 理论 7 的 基本 先 验 概率 了 P[ 呈 换 成 当 
前 的 置信 和 度 P7ID]， 而 替代 理论 的 基本 先 验 概率 IPLA] 也 会 被 换 成 当前 的 置信 度 
P[4ID]。 实 用 贝 叶 斯 主义 者 在 贝 叶 斯 公式 中 用 到 的 正 是 这 些 当 前 的 置信 和 度 。 在 之 
后 的 章节 中 ， 我 们 会 看 到 这 个 原则 不 仅 处 于 达尔 文 式 演化 的 核心 ， 同 样 也 处 于 科 
学 共识 与 实时 机 器 学 习 可 靠 性 的 核心 。 

这 些 计算 也 说 明 ， 对 于 纯粹 贝 叶 斯 主义 者 来 说 ， 用 理性 的 方式 研究 历史 是 完 
全 可 行 的 。 对 于 某 些 人 来 说 ， 历 史 、 物 种 演化 与 宇宙 学 这 些 学 科 并 非 科 学 ， 因 为 
它们 不 能 通过 可 重复 的 实验 来 研究 。 有 趣 的 是 ， 这 种 思考 不 过 是 来 自 波 普尔 哲学 
以 及 频率 主义 统计 学 的 单纯 假象 。 
D 从 技术 上 来 说 ， 甚 至 在 所 有 理论 了 和 4 之 中 ， 新 数据 ND 都 应 与 旧 数 据 DD 独立 。 
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[ay 

















对 于 纯粹 贝 叶 斯 主义 者 而 言 ， 在 尝试 回溯 宇宙 历史 的 这 些 学 科 与 那些 研究 不 


随时 间 而 改变 的 法 则 的 其 他 学 科 之 间 ， 





并 没有 绝对 的 界限 。 在 这 两 种 情况 下 ， 人 

















们 要 做 的 都 是 收集 相关 数据 ， 然 后 进行 贝 叶 斯 推断 来 确定 对 于 不 同 理 论 的 合适 的 


置信 度 。 


























特别 要 提出 的 是 ， 对 于 纯粹 贝 叶 其 


1 主义 者 来 说 ， 将 “科学 ”与 “ 伪 科 学 ”分 








开 的 ， 不 能 说 是 这 些 学 科 中 假设 的 可 证 伪 性 ”“， 而 应 该 是 相信 这 些 假设 的 人 应 用 贝 





























叶 斯 公式 的 准确 性 。 科 研 人 员 对 贝 叶 其 
看 到 ， 科 学 共同 体 对 贝 叶 斯 公式 的 应 用 要 比 其 中 任何 个 体 都 更 准 而 























再 谈 爱 因 斯 坦 





1 公式 的 应 用 要 准确 得 多 ， 而 且 我 们 之 后 会 



































为 了 更 好 地 理解 纯粹 贝 叶 斯 主义 者 的 哲学 ， 我 们 回 到 爱 因 斯 坦 的 例子 。 要 注 


























意 的 第 一 件 事 就 是 ， 尽 管 爱 因 斯 坦 的 ) 
说 过 于 抽象 ， 但 它 实 际 上 简单 得 惊人 。 






































义 相对 论 对 同时 期 的 绝 大 多 数 物理 学 家 来 
的 确 ， 广 义 相 对 论 可 以 浓缩 为 一 句 话 : 四 











维 时 空 的 曲率 由 等 式 G,, oc 7 确定。 细节 并 不 重要 ， 要 注意 的 是 这 个 公式 只 有 一 
个 参数 ， 也 就 是 等 式 的 比例 常数 。 这 个 常数 描述 了 物质 7,, 对 时 空 曲率 G, 的 影响 


程度 。 


另外 ， 牛 顿 的 万 有 引力 定律 Wia oc mm,r /也 只 包含 一 个 系数 ， 它 描述 了 物 
体 的 质量 对 物体 之 间 的 引力 的 影响 程度 。 然 而 牛顿 的 万 有 引力 定律 也 额外 假设 了 
阻碍 物体 加 速 的 惯性 质量 M, 等 于 (或 等 比 于 ) 引力 质量 m,。 这 样 的 话 ， 即 使 牛 
顿 的 定律 似乎 更 容易 理解 ， 也 更 容易 计算 ,但 它 实 际 上 比 爱 因 斯 坦 的 理论 包含 更 














多 的 随意 之 处 。 



































今天 ， 人 们 甚至 知道 爱 因 斯 坦 的 理论 能 被 改动 的 地 方 少 到 了 什么 程度 。 人 们 








首 
还 证 明了 所 有 分 量 都 是 度 规 张 量 本 身 、 


T 








其 一 阶 导 数 或 二 阶 导 数 ， 而 且 散 度 为 零 的 

















二 阶 对 称 张 量 必定 是 度 规 张 量 与 爱 因 


斯 坦 张 量 的 线性 组 合 。 不 巧 的 是 ， 解 释 这 个 




















数学 定理 需要 很 长 的 篇 幅 中。 我 们 只 需 记 住 ， 爱 因 斯 坦 方 程 并 不 是 随意 写 出 来 的 。 





C 尽管 如 此 ， 我 们 在 第 7 章 也 会 看 到 ， 所 有 优秀 的 理论 都 应 该 有 预测 能 力 ,但 只 有 在 两 种 可 能 











性 时 ， 理 论 的 预测 结果 如 果 是 对 半 开 ， 那 


我 们 也 应 该 承认 理论 在 这 个 问题 上 的 无 知 。 
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时 空 曲率 引发 了 被 我 们 误 称 为 “引力 ”的 东西 ， 而 爱 因 斯 坦 方程 正 是 这 一 简单 公 
设 不 可 避免 的 结果 。 这 也 是 为 什么 希 尔 伯 特 也 独立 地 发 现 了 与 爱 因 斯 坦 一 样 的 方 
































程 。 这 种 不 可 避免 的 性 质 让 爱 因 斯 坦 的 理论 在 先 验 上 远 远 比 牛 顿 定理 更 可 信 。 因 
此 ， 即 使 没有 任何 观察 结果 ， 接 受 爱 因 斯 坦 的 理论 而 不 是 牛顿 的 理论 也 不 无 道理 。 
在 爱 因 斯 坦 确 定 这 个 方程 的 那 一 刻 ， 他 并 不 知道 这 就 是 他 最 初 的 公设 不 可 避 



































免 的 结论 。 但 公式 本 身 十 分 优雅 ,又 因为 在 错误 公式 上 




















浪费 了 数 年 而 遭受 挫折 ， 


爱 因 斯 坦 在 这 些 因素 的 影响 下 产生 了 灵光 一 现 的 感觉 。 从 这 一 刻 开始 ， 他 对 新 理 
论 的 置信 度 就 已 经 高 于 对 牛顿 运动 定律 的 置信 和 度 , 或 者 至 少 足 够 高 ， 足 以 让 他 产 
生 推 翻 牛 顿 的 抱负 ， 这 也 不 算 惊 人 。 但 最 后 让 天 平 完全 倒 向 他 这 边 的 ， 当 然 还 是 

















实验 观察 的 因素 。 











在 引力 很 “ 弱 ” 时 ， 爱 因 斯 坦 的 广义 相对 论 与 牛顿 的 定律 表现 相同 。 实 际 上 ， 




















在 太阳 系 中 ， 只 有 在 靠近 太阳 的 地 方 ， 引 力 才 强 得 足以 使 爱 因 斯 坦 方程 的 预测 俩 





离 牛顿 运动 定律 的 预测 ， 而 当时 这 方面 的 数据 还 很 欠缺 。 
不 能 完全 解释 水 星 的 轨道 ， 而 水 星 是 在 最 强 的 引力 场 中 
说 ， 是 在 时 空 最 弯曲 的 区 域 中 ) 公转 的 行星 。 







































































然而 ， 牛 顿 的 理论 似乎 
(或 者 用 爱 因 斯 坦 的 话 来 




















当然 ,也 有 可 能 存在 与 祝融 星 类 似 的 行星 可 以 解释 水 星 的 轨迹 。 但 众多 天 文 











观察 者 在 数 十 年 间 对 祝融 星 的 寻找 中 一 无 所 获 。 昌 然 证 扩 
的 证 据 ， 但 这 只 会 对 祝融 星 存在 的 置信 度 产生 负面 影响 。 





























居 的 缺失 并 不 能 作为 缺失 


然而 ， 未 被 观察 到 的 行星 影响 水 星 轨迹 这 个 更 有 可 能 发 生 的 情况 并 没有 发 生 ， 





























爱 因 斯 坦 的 理论 却 能 出 色 地 解释 水 星 的 轨迹 。 即 使 爱 因 











斯 坦 理 论 的 先 验 置信 和 度 与 
牛顿 力学 相当 ， 它 在 不 依赖 极 不 可 能 的 假设 的 情况 下 ， 也 能 完美 解释 水 星 的 轨迹 ， 


























这 一 事实 就 扫除 了 纯粹 贝 叶 斯 主义 者 的 所 有 疑问 : 贝 叶 斯 公式 指出 ， 爱 因 斯 坦 理 

















论 的 置信 度 要 远 远 高 于 牛顿 理论 。 


























毫 无 疑问 ， 爱 因 斯 坦 和 和 希 尔 伯 特 从 直觉 上 就 做 出 了 这 种 贝 叶 斯 推理 。 从 1915 
年 开始 ， 与 整个 科学 共同 体 相左 的 是 ， 这 两 位 科学 家 早已 确信 广义 相对 论 是 最 可 























信 的 引力 理论 ， 没 有 别 的 理论 能 出 其 右 。 纯 粹 贝 叶 斯 主义 





























者 也 同意 这 一 点 。 


所 有 人 类 知识 从 直觉 开始 ， 然 后 转变 为 观 
念 ， 最 后 化 为 思想 。 
Jr ARR + AUS (1724—1804 ) 
根据 贝 叶 斯 定理 ， 任 何 理论 都 不 完美 。 取 而 
代 之 的 是 一 项 未 竟 的 工作 ， 它 永远 处 于 推 殴 
与 测试 之 中 。 
AA + AR (1978— ) 


琳 达 问题 





琳 达 31 岁 ， 独 身 ， 为 人 诚恳 且 充满 智慧 


第 今 章 
荣耀 归于 偏见 


。 她 学 习 过 哲学 。 她 在 还 是 大 学 生 的 


时 候 很 关心 收视 与 社会 正义 的 问题 ， 也 曾 参 加 反 核 游行 。 下 面 哪 一 个 陈述 更 有 可 





能 是 正确 的 ? 


1. 琳 达 是 银行 办 事 员 。 





2. 琳 达 是 银行 办 事 员 ， 并 且 活 路 在 女权 运动 中 。 








请 你 花 点 时 间 思 考 一 下 ， 在 继续 阅读 之 前 大 声 说 出 你 的 答案 。 

















这 个 问题 有 一 个 著名 的 名 字 ， 叫 “ 琳 达 问题 ”， 它 是 由 阿 莫 斯 ， 特 沃 斯 基 和 丹 
ER * 卡 内 曼 这 两 位 心理 学 人 研究 者 提出 的 ， 他 们 希望 更 好 地 理解 人 们 是 如 何 思考 











的 。 也 正 因 为 这 项 研究 及 其 他 工作 ， 卡 内 曼 获得 了 2002 年 的 诺 贝尔 经 济 学 奖 。 卡 























内 曼 在 他 的 杰作 《思考 ， 快 与 慢 》 中 写 道 ， 如 果 特 沃 斯 基 没 有 在 1996 年 去 世 ， 这 





两 位 研究 者 可 能 会 分 享 诺 贝尔 奖 。 
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琳 达 问题 之 所 以 如 此 著名 ， 是 因为 答案 的 错误 率 非常 高 。 在 特 沃 斯 基 和 卡 内 
曼 的 多 次 实验 的 参与 者 之 中 ，85%~91% 的 人 给 出 了 错误 的 答案 。 我 们 聪颖 的 人 类 
大 脑 在 这 个 问题 上 的 表现 显然 比 随机 回答 的 猩猩 差 得 多 ! 

一 些 批评 人 士 提出 ， 选 项 1 的 模糊 说 法 可 能 会 让 人 觉得 琳 达 在 女权 运动 中 不 

活跃 。 然 而 ， 即 使 将 选项 1 替换 为 更 清晰 的 “ 琳 达 是 银行 办 事 员 ， 她 在 女权 和 运动 
中 活跃 或 者 不 活跃 "， 答 案 的 错误 率 仍然 停留 在 57% 一 一 还 是 比 猩 猩 更 糟糕 。 
如 果 你 没有 正确 回答 这 个 问题 ， 那 么 你 可 能 会 惊奇 于 其 中 一 个 选项 是 正确 的 ， 
而 另 一 个 是 错误 的 ， 但 事实 如 此 。 的 确 ， 选 项 2 是 选项 1 的 特殊 情况 。 换 名 话说 ， 
如 果 选 项 2 正确 的 话 ， 那 么 选项 1 也 正确 。 用 维 思 图 来 解释 ， 由 选项 2 正确 的 情 
况 组 成 的 集合 是 由 选项 1 正确 的 情况 组 成 的 集合 的 子 集 。 用 概率 的 术语 来 说 ， 我 
这 里 说 的 东西 可 以 浓缩 为 不 等 式 P[ 银行 办 事 员 及 女权 主义 者 ] < P[ 银行 办 事 员 ]。 
两 个 事件 都 发 生 的 概率 必定 低 于 其 中 一 个 事件 发 生 的 概率 。 这 里 的 数学 证 明 无 懈 
可 击 。 选 项 1 就 是 正确 答案 。 

即使 没有 选中 正确 答案 ， 你 还 是 可 以 庆幸 自己 与 大 部 分 人 一 样 。 没 多 少 人 能 
进行 上 述 的 数学 推理 。 特 沃 斯 基 和 卡 内 曼 认 为 ， 与 其 进行 数学 推理 ， 人 们 进行 的 
其 实 是 关联 性 的 推理 。 他 们 思考 的 不 是 选项 1 和 选项 2 的 概率 ， 而 是 选项 1 和 选 

2 对 于 题 干 对 琳 达 的 描述 具有 多 少 代表 性 。 对 于 31 岁 、 独 身 、 接 受过 高 等 教 
参加 过 反 歧 视 运 动 的 女性 来 说 ， 选 项 2 似乎 更 有 代表 性 。 
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用 偏见 解释 琳 达 问题 x 


也 许 有 男 一 种 更 发 人 深 省 的 方法 有 助 于 理解 琳 达 问题 难以 置信 的 错误 率 ， 它 
会 将 我 们 直接 引导 到 频率 主义 者 与 贝 叶 斯 主义 者 之 间 的 论争 中 。 对 于 醉心 于 p 值 
的 纯粹 频率 主义 者 来 说 ， 对 假说 的 测试 就 是 在 已 知 假设 的 情况 下 人 研究 观察 数据 出 
现 的 概率 。 所 以 ， 纯 粹 频率 主义 者 会 对 概率 P 题 干 |1] 和 P[ 题 干 |2] 更 有 兴趣 ， 
这 里 1 和 2 分 别 代表 选项 1 和 选项 2。 

认为 比 起 选项 1， 在 假设 选项 2 正确 的 情况 下 题 干 更 可 能 正确 ， 这 是 合理 的 。 
用 形式 语言 来 说 ， 我 们 有 不 等 式 P EE |1] 三 P[ 题 干 |2]。 用 统计 术语 来 说 ， 题 干 
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对 于 选项 2 来 说 更 似 然 ， 而 且 选 项 2 是 最 似 然 的 。 

不 幸 的 是 ， 我 们 在 第 4 章 中 说 到 的 “科学 方法 ”通常 只 关心 这 些 似 然 度 。 这 
个 术语 没什么 帮助 ， 反 而 误导 了 我 们 。 它 让 我 们 更 容易 混淆 数据 在 某 个 假设 的 前 
提 下 的 似 然 度 与 假设 本 身 成 立 的 概率 。 对 于 纯粹 贝 叶 斯 主义 者 来 说 ， 这 就 是 纯粹 
频率 主义 者 的 雇 误 之 处 。 

然而 这 些 似 然 度 ( 在 第 2 章 中 ,我 也 把 它们 叫 作 思想 实验 项 ) 只 是 贝 叶 斯 公 
式 的 一 部 分 。 对 于 纯粹 贝 叶 斯 主义 者 来 说 ,重要 的 是 逆 概 率 。 在 琳 达 问题 的 情况 
中 ， 逆 概率 就 是 在 已 知 题 干 的 前 提 下 每 个 选项 的 概率 。 你 大 概 开始 明白 了 ， 这 个 
道 概率 可 以 从 贝 叶 斯 公式 导出 。 对 于 选项 1， 贝 叶 斯 公式 可 以 写成 : 






























































P|[ 题 干 |1]P[1 P[ 题 行 办 事 员 ] :P| 银行 办 事 员 
PI1| 题 干 ] = 一 一 zu uns [银行 办 事 员 ] 














同样 ， 在 已 知 题 干 的 前 提 下 ， 选 项 2 的 概率 可 以 写成 : 


P| 题 干 | 银行 办 事 员 目 女权 主义 者 | .P[ 银 行 办 事 员 且 女权 主义 者 ] 
PT 


























P[2| 题 干 ] = 





纯粹 贝 叶 斯 主义 者 比较 两 个 概率 后 就 能 得 出 结论 。 关 键 在 于 ， 不 管 表达 式 右 
边 的 未 知 量 估计 结果 如 何 ， 只 要 这 些 量 遵 循 概率 定律 ， 纯 粹 贝 叶 斯 主义 者 就 必 
定 会 得 出 概率 P[1| 题 干 ] 大 于 概率 P[2| 题 干 ] 的 结论 。 她 必定 会 给 出 正确 的 答 
案 一 一 跟 纯 粹 频率 主义 者 正好 相反 。 

更 妙 的 是 ， 我 们 可 以 计算 在 已 知 题 干 的 前 提 下 ， 纯 粹 贝 叶 斯 主义 者 会 认为 选 
项 1 比 选项 2 的 可 能 性 大 多 少 。 的 确 ， 只 要 摆弄 一 下 概率 法 则 ( 请 你 也 反复 计算 
一 下 )， 我 们 就 能 看 出 第 二 个 计算 等 价 于 : 


P[2| 题 干 ] = P[ 女 权 主 义 者 | 题 干 且 银行 办 事 员 ] - P[1| 题 干 

































































换 种 说 法 ， 无 论 纯粹 贝 叶 斯 主义 者 提出 什么 假设 ， 它 们 都 应 该 符合 概率 法 则 。 
至 此 为 止 ， 纯 粹 贝 叶 斯 主义 者 必然 会 得 出 这 样 的 结论 : 在 已 知 题 干 的 前 提 下 ， 选 
项 2 的 概率 是 选项 1 的 P[ 女权 主义 者 | 题 干 且 银 行 办 事 员 ] 倍 。 因 为 所 有 概率 都 
小 于 等 于 1， 我 们 由 此 可 得 ， 在 已 知 题 干 的 前 担 下， 无 论 考虑 什么 〈 贝 叶 斯 ) 模 
型 ， 选 项 2 总 是 比 选项 1 更 不 可 能 。 对 两 个 选项 概率 的 比较 可 以 归结 为 对 一 个 思 
想 实 验 的 计算 一 一 在 已 知 题 干 条 件 以 及 琳 达 是 银行 办 事 员 的 前 提 下 ， 她 活跃 在 女 
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权 运 动 中 的 概率 。 














你 可 能 会 觉得 纯粹 贝 叶 斯 主义 者 在 这 里 的 论证 实在 太 复杂 了 。 毕 兑 要 得 到 琳 
1 需要 观察 到 选项 2 蕴涵 选项 1 就 可 以 了 。 这 当然 有 道理 。 
我 向 你 展示 纯粹 贝 叶 斯 主义 者 的 论证 ,不 是 为 了 让 你 更 好 地 理解 琳 达 问题 ， 而 是 
为 了 向 你 展示 纯粹 贝 叶 斯 主义 者 的 论证 方式 与 纯粹 频率 主义 者 有 什么 不 同 。 纯 粹 
贝 叶 斯 主义 者 不 会 满足 于 对 似 然 度 的 计算 ， 她 在 分 析 中 也 会 考虑 自己 得 出 的 选项 1 
和 选项 2 的 先 验 概率 。 

用 符号 化 的 语言 来 说 ， 对 纯粹 贝 叶 斯 主义 者 而 言 ， 最 重要 的 量 不 是 似 然 度 
PLF |], MERER PU 题 干 ]。 这 个 量 可 以 通过 贝 叶 斯 公式 从 似 然 度 得 到 : 
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要 注意 到 ， 似 然 度 P 题 干 |1] 旁边 应 该 跟着 先 验 概 率 P[1]。 

在 这 本 书 里 ,我 会 冒 一 点 风险 ， 把 “ 先 验 概率 ”这 个 技术 名 词 换 成 会 带 来 负 
面 联想 的 “偏见 ”"。 这 是 我 为 了 诚实 思考 所 做 出 的 努力 。 正 因为 我 有 着 倾向 于 贝 叶 
新 主义 的 认 知 偏差 ， 所 以 我 才 要 尝试 为 贝 叶 斯 哲学 的 这 个 带 有 负面 意义 的 版 本 准 
护 ， 尝 试 说 服 你 ， 即 使 是 这 个 版 本 也 很 吸引 人 。 这 跟 仅 依靠 字 词 的 正面 联想 来 说 
服 别人 的 假 大 空话 术 背 道 而 驰 。 不 要 忘记 偏见 的 字面 意义 : 在 观察 前 所 做 的 判断 。 

所 以 ,偏见 正人 处 于 贝 叶 斯 主义 者 和 频率 主义 者 论争 的 中 心 。 这 些 偏 见 正 是 
19~20 世纪 贝 叶 斯 公式 不 被 接受 的 主要 原因 。 科 学 应 当 客 观 ， 而 偏见 似乎 必然 是 主 
观 的 。 对 于 频率 主义 者 和 大 部 分 科学 家 来 说 ， 这 些 主观 偏见 正 是 贝 叶 斯 哲学 的 致 
命 缺 陷 。 

然而 ， 主 观 毫 不 随意 。 即 使 说 贝 叶 斯 偏见 是 主观 的 ， 它 们 也 绝 非 任意 而 成 
的 ! 贝 叶 斯 偏见 遵循 概率 法 则 ， 而 且 在 更 理想 的 情况 下 ， 它 们 应 该 (部 分 ) 出 自 
贝 叶 斯 公式 的 计算 。 正 如 偏见 在 琳 达 问题 中 扮演 了 重要 角色 一 样 ， 纯 粹 贝 叶 斯 主 
义 者 甚至 认为 ,这些 偏 见 正 是 贝 叶 斯 推理 的 力量 源泉 ， 前 提 是 这 些 偏见 是 由 正 古 









































































































































































































































62 | 贝 叶 斯 的 博弈 : 数学 、 思 维 与 人 工 智 角 





[ay 





















































的 贝 叶 斯 方法 得 来 的 。 对 纯粹 贝 叶 斯 主义 者 而 言 ， 为 了 进行 正确 的 推理 ,偏见 必 
不 可 少 。 偏 见 组 成 了 理性 的 基础 。 的 确 ， 没 有 偏见 ， 就 得 不 出 任何 结论 。 这 就 是 


贝 叶 斯 哲学 最 受 争议 的 断言 。 












































xkcd” 的 太阳 








看 对 如 此 违反 直觉 又 饱 受 争议 的 断言 ， 琳 达 问 题 这 个 例子 不 足以 说 明 问 题 ， 
所 以 我 建议 你 研究 兰 道 尔 ' 门 罗 提 出 的 一 个 绝妙 的 思想 实验 中， 而 我 会 用 自己 的 
方法 来 重新 闻 述 它 。 

想象 一 下 你 在 法 国 巴黎 ， 你 手下 的 实习 生 在 美国 夏威夷 。 在 午夜 前 一 刻 ， 他 
搓 了 两 枚 观 子 。 如 果 两 枚 都 掷 出 6， 他 就 会 跟 你 说 太阳 消失 了 ; 和 否则， 他 就 会 告诉 
你 太阳 实际 上 是 否 消失 了 。 午 夜 到 了 ， 实 习 生 打 来 电话 ， 告 诉 你 太阳 消失 了 。 你 
会 得 出 什么 结论 ? 

还 记得 吗 ? 要 得 出 结论 ， 科 学 方法 就 要 排除 替代 的 假设 。 要 得 出 太阳 消失 的 
结论 ， 就 必须 排除 太阳 仍然 存在 的 替代 假设 闲 。 为 了 排除 头 ， 纯 粹 频率 主义 者 应 该 
计算 与 3 相关 的 p 值 。 换 句 话说 ， 他 会 计算 在 太阳 没有 消失 的 前 提 下 你 得 知 现 有 
消息 的 概率 p=P[ 多 守 ]。 一 个 非常 小 的 p 值 说 明了 在 假设 下 极 不 可 能 得 到 数据 多 ， 
这 就 说 明 应 该 排除 富 。 

然而 ， 在 已 知 宇 的 情况 下 ， 如 果 你 想 接 到 刚才 那 通 电话 罗 ， 你 的 实习 生 
就 必须 撕 出 一 对 6， 所 以 概率 p=P[ 旬 3] 就 等 于 掷 出 一 对 6 的 概率 ， 也 就 是 
p=1/36 = 0.028, HERMA p < 0.05。 我 们 可 以 就 此 得 出 结论 ， 在 六 的 前 提 下 ， 
实习 生 告 诉 了 你 太阳 消失 的 这 个 事件 极 不 可 能 发 生 。 所 以 我 们 应 该 否定 理论 之。 
然而 ， 和 否定 理论 去， 就 是 推翻 了 太阳 没有 消失 的 事实 ， 所 以 得 出 的 结论 就 是 太阳 
消失 了 。 

实在 难以 置信 ! 我 们 跟随 纯粹 频率 主义 者 的 脚步 ， 得 出 的 结论 却 荒 廖 绝伦 : 
仅仅 因为 实习 生 告 诉 我 们 太阳 消失 了 ， 我 们 就 应 该 得 出 太阳 的 确 消失 的 结论 ! 兰 





































































































D HER- 门 罗 的 网 名 ， 也 是 他 所 创作 的 漫画 的 名 称 。 
Q 在 这 里 ， 多 表示 实习 生 说 太阳 消失 了 。 
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ER + 门 罗 的 结论 ， 就 是 纯粹 贝 叶 斯 主义 者 因为 觉得 纯粹 频率 主义 者 得 出 的 结 
论 相 当 可 笑 而 做 出 的 回应 :我 跟 你 赌 50 块 钱 太阳 没 消失 。” 奇 怪 的 是 ， 与 通过 频 
率 主义 者 要 求 的 “科学 方法 ”得 到 的 结果 相 比 ， 纯 粹 贝 叶 斯 主义 者 的 结论 似乎 更 





合理 。 


用 偏见 解释 xkcd 























所 幸 ， 科 学 家 有 进行 贝 叶 




















斯 式 思考 的 动力 ， 不管 他 们 有 没有 意识 到 这 一 点 。 











当 我 向 别人 讲述 这 个 思想 实验 时 ， 没 有 人 认为 纯粹 贝 叶 斯 主义 者 不 理智 得 可 笑 。 
要 理解 这 个 原因 ， 就 要 考虑 纯粹 贝 叶 斯 主义 者 如 何 确定 不 同 理论 的 置信 和 度 。 为 什 
么 即使 在 接 到 实习 生 的 来 电 之 后 ， 纯 粹 贝 叶 斯 主义 者 仍然 更 相信 太阳 依旧 存在 ? 
管 案 就 在 纯粹 贝 叶 斯 主义 者 的 偏见 之 中 。 这 种 偏见 并 非 随意 的 ， 而 是 由 所 有 
过 往 的 观察 结果 决定 的 。 如 果 将 她 的 所 有 经 历 记 作 V, 那么 贝 叶 斯 公式 就 会 导出 : 
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Pi 
Br]- 7 PRI 


细节 可 能 看 起 来 很 吓人 ， 你 可 以 忽略 它们 。 但 我 想 提醒 你 注意 P[o|V] 这 一 











项 。 这 就 是 纯粹 贝 叶 斯 主义 者 在 接 到 实习 生 电话 之 前 的 偏见 。 它 是 以 纯粹 贝 叶 斯 











主义 者 的 所 有 经 历 为 条 件 而 决定 的 先 验 概率 。 这 些 经 历 包 括 目前 为 止 每 天 都 能 看 
到 太阳 升 起 的 观察 结果 ， 也 包括 物理 课 的 内 容 。 这 些 物 理 课 断 言 ， 太阳 是 一 个 由 
























































等 离子 体 组 成 的 球 ， 能 量 由 氧 原子 核 的 核 聚变 提供 ， 而 氢 的 数量 十 分 充足 ， 足 够 
太阳 继续 在 数 十 亿 年 内 发 光 发 热 外。 








个 世纪 的 科研 成 果 。 也 就 是 说 





看 过 数 千 次 太阳 升 起 ， 他 们 都 会 








所 以 说 ， 主 观 毫 不 随意 ! 在 这 个 案例 中 ， 这 种 主观 性 的 基础 之 一 就 是 过 去 数 

















， 贝 叶 斯 主义 者 经 历 各 异 ， 但 只 要 经 历 足够 丰富 ， 














司 意 这 一 点 : 纯粹 频率 主义 者 所 醉心 的 p 值 带 来 








的 答案 并 不 正确 。 实 际 上 ， 对 于 所 有 贝 叶 斯 主义 者 来 说 ， 在 接 到 实习 生 电 话 之 前 


太阳 就 已 消失 的 先 验 概率 PI dE 








太极 小 。 正 是 这 种 




















微小 的 置信 度 ， 即 使 实习 生 打 来 了 那 通 电话 。 
一 般 而 言 ， 任 何 数据 都 不 应 该 被 单独 分 析 。 数 据 如 同 碎 石 ， 如 非 置 于 宏伟 建 











局 见 让 我 们 向 太阳 消失 只 赋予 
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筑 之 中 则 毫 无 意义 。 


用 偏见 为 萨 莉 克拉克 辩护 


为 了 悟 透 这 一 点 ， 我 们 来 重新 审视 第 2 RAI AI BEA + 克拉 克 的 案件 。 你 可 
能 还 记得 萨 莉 .克拉 克 在 短 短 两 年 里 就 痛 失 了 两 名 亲生 骨肉 ， 导 臻 她 被 怀疑 进行 
了 双重 谋杀 。 然 而 ， 我 们 已 经 知道 ， 实 际 上 我 们 感 兴趣 的 是 在 已 知 两 名 新 生 儿 死 
CAHE, WEE o ERK 严 包 | 外。 对 于 这 个 情况 ， 我 们 之 前 应 用 贝 叶 斯 公 
式 的 结果 是 : 
































网 à e 
«ej - PEIUS] 


利用 p 值 或 似 然 度 判断 的 方法 将 我 们 的 注意 力 引 到 了 思想 实验 项 P[ 人 |@] 
上 ， 它 描述 的 是 在 萨 莉 :克拉克 无 这 的 前 提 下 解释 两 名 新 生 儿 死亡 的 难度 。 儿 科 
ERP UT + 梅 多 犯 下 的 错误 也 就 是 所 谓 的 检察 官 雇 误 ， 其 中 深 植 着 频率 主义 ， 因 
为 它 强 调 了 这 个 思想 实验 项 的 值 小 得 难以 置信 。 毫 无 疑问 ， 似 然 度 ， 也 就 是 无 
事 的 人 看 着 自己 的 两 名 新 生 儿 死去 的 概率 PA e ] 小 得 令 人 感到 荒诞 。 梅 多 估计 
这 个 概率 是 7000 万 分 之 一 ， 也 就 是 大 概 0.000 001%。 这 上 比 物理 学 中 用 到 的 阔 值 
0.000 03% 还 要 小 ! 与 检察 官 一 样 ， 只 根据 p 值 判 断 的 纯粹 频率 主义 者 只 能 排除 萨 
Aij + 克拉 克 无 罪 的 假设 名 ， 将 她 定罪 。 

数学 教授 雷 : 看 尔 对 这 个 判决 提出 的 异议 ， 归 功 于 一 项 深 植 着 贝 叶 斯 主义 的 论 
证 。 和 看 尔 教 授 认为 必须 应 用 贝 叶 斯 公式 ， 也 就 是 尤其 需要 考虑 无 菲 推定 项 PL 6 ]. 
只 有 将 这 项 偏见 纳入 推理 之 中 ,我 们 才能 更 好 地 理解 萨 莉 .克拉 克 的 处 境 ， 从 而 
得 到 对 她 来 说 更 准确 的 判决 。 

与 某 些 “ 科 学 方法 ”的 支持 者 所 提倡 的 正好 相反 ， 纯 粹 贝 叶 斯 主义 者 认为 偏 
见 并 不 是 我 们 思考 中 需要 排除 的 缺陷 。 要 进行 正确 的 思考 ， 偏 见 必 不 可 少 。 
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用 偏见 对 抗 伪 科 学 


这 个 将 我 们 从 琳 达 问题 、xkcd 的 思想 实验 以 及 萨 莉 ' 克拉 克 的 审判 中 拯救 出 
来 的 原则 有 着 数不胜数 的 应 用 ， 主 要 用 于 处 理 高 度 可 能 或 高 度 不 可 能 的 理论 。 

因此 ， 纯 粹 贝 叶 斯 主义 者 甚至 不 会 花心 思 倾 听 那 些 声称 可 以 凭空 创造 角 
人 的 说 法 。 因 为 能 量 守恒 定律 是 所 有 物理 理论 的 基本 原则 ， 所 以 她 对 凭空 创造 能 
量 的 不 可 能 性 有 着 深刻 的 赞同 偏见 。 除 此 之 外 ， 在 能 量 守恒 的 假设 下 ， 这 个 世界 
上 仍然 非常 可 能 有 一 些 人 出 于 错误 的 理由 确信 自己 完成 了 这 样 的 实验 一 一 我 们 之 
后 会 谈 到 诉 诸 权 威 的 贝 叶 斯 诠释 。 无 须 看 那些 视频 ,偏见 足以 否定 这 种 实验 。 

同样 ， 纯 粹 贝 叶 斯 主义 者 对 有 关 超 自然 现象 的 伪 科 学 理论 也 有 着 强烈 的 偏见 ， 
无 论 是 扭曲 汤 勺 的 心灵 致 动 ， 还 是 预见 未 来 的 预知 能 力 都 违背 了 物理 学 的 基本 定 
律 。 然 而 ， 纯 粹 贝 叶 斯 主义 者 会 向 这 些 基 本 定律 赋予 非常 大 的 置信 和 度 。 另 外 ， 大 
量 类 似 事例 最 终 都 被 证 实 是 欺诈 ， 各 种 认 知 偏差 也 能 解释 为 什么 参与 这 些 实验 的 
人 会 深信 不 疑 ， 这 些 因素 同样 使 贝 叶 斯 主义 者 在 伪 科学 的 支持 者 尝试 说 服 她 时 不 
会 改变 自己 对 这 些 伪 科学 的 置信 度 。 即 使 在 伪 科 学 理论 错误 的 前 提 下 ， 她 也 很 可 
FENETRE o 
这 并 不 是 说 纯粹 贝 叶 斯 主义 者 从 来 不 会 改变 想法 。 但 在 这 种 情况 下 ， 需 要 的 
是 非 同 寻常 的 数据 D。 要 让 置信 度 转 移 到 某 个 替代 理论 4 上 的 话 ， 那么 PLDA] 都 
必须 远大 于 任何 可 能 理论 了 的 思想 实验 项 P[D|7]。 然 而 我 们 会 在 第 10 章 看 到 ， 选 
择 偏 差 实际 上 会 导致 PLDI7] 通常 相当 大 ， 其 至 对 于 那些 看 起 来 很 神秘 的 数据 D 来 
说 也 是 如 此 名。 要 使 替代 理论 4 一 下 子 变 得 与 7 一 样 可 信 ，P[DI4]/PLDI7] 就 必须 
至 少 能 媲美 这 两 个 理论 的 先 验 置 信和 度 比值 的 倒数 ,也 就 是 P[7]J/P[4]*。 然 而 近 几 个 
世纪 以 来 ， 日积月累 的 科学 知识 让 第 二 个 比值 巨大 无 比 。 正 如 卡尔 . 萨 根 所 说 : 
“ 非 同 寻常 的 断言 需要 非 同 寻常 的 证 据 。” 我 们 刚才 正 是 以 贝 叶 斯 主义 为 基础 证 明 
了 这 个 原则 的 有 效 性 ! 

又 或 者 说 ， 为 了 让 贝 叶 斯 主义 者 从 根本 上 改变 想法 ， 就 必须 向 她 提出 从 未 考 
虑 过 的 理论 一 一 这 个 论证 作为 说 服 纯粹 贝 叶 斯 主义 者 的 方法 并 不 成 立 ， 因 为 我 们 
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中 ”请 用 贝 叶 斯 公式 证 明 这 一 点 ! 
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将 会 在 第 7 章 看 到 ， 纯 粹 贝 叶 斯 主义 者 知道 所 有 ( 可 计算 的 ) 理论 。 这 种 替代 理 
论 的 基础 也 应 该 有 如 主流 物理 理论 那样 可 信 。 另 外 ,这样 的 替代 理论 同样 应 该 能 





很 好 地 角 





坚 释 科学 史上 的 物 弄 














E 观 察 结果 。 最 后 ， 替 代理 论 还 应 该 能 对 特定 的 现象 做 














出 更 好 的 解释 ， 正 如 水 星 轨迹 和 爱 因 斯 坦 广义 相对 论 的 情况 。 
反 过 来 说 ， 即 使 经 验 数据 严重 缺失 ， 纯 粹 贝 叶 斯 主义 者 也 可 以 对 某 些 断言 赋 



































予 非常 大 的 置信 和 度 。 例 如 ， 如 果 我 对 纯粹 贝 叶 斯 主义 者 说 ， 我 之 前 攀登 过 喜 马 拉 
雅 山 脉 上 一 座 海拔 超过 6000 米 的 高 峰 ， 然 后 又 对 她 说 这 次 登山 十 分 痛苦 ， 那 么 她 


无 须 经 验 数据 就 会 相信 ， 


























以 我 的 健康 状况 来 说 ， 这 次 登山 并 不 是 小 菜 一 碟 。 如 果 














纯粹 贝 叶 斯 主义 者 仅 凭 几 句 证 言 就 相信 了 我 当时 的 疲惫 ， 那 是 因为 她 怀 着 深 深 的 
偏见 ， 认 为 我 缺少 无 须 把 肺 咳 出 来 就 能 柳 上 高 峰 的 能 力 。 




















偏见 拯救 科学 


在 科学 家 对 经 验 中 的 反常 情况 的 处 理 上 ,偏见 也 能 得 出 非常 有 用 的 结论 。 我 














斯 坦 的 狭义 相对 论 

















门 之 前 也 提 到 ， 在 OPERA 实验 团队 认为 探测 到 了 以 超 光 速 运动 的 中 微 子 时 ， 迎 接 
这 个 消息 的 是 遍及 全 球 的 怀疑 。 不 仅 理论 物理 学 家 提出 了 怀疑 ， 就 连 实验 者 自身 
岂 很 怀疑 ! 之 后 不 出 任何 人 的 意料 ， 人 们 发 现 了 实验 有 缺陷 。 物 理学 家 对 于 爱 因 

















它 断 言 任何 粒子 的 运动 都 不 可 能 超越 光速 一 一 的 置信 度 是 














如 此 巨大 ， 以 至 于 “实验 有 错误 ”的 假设 比 “ 爱 因 斯 坦 的 理论 出 错 ” 更 可 信 。 





更 奇怪 的 是 ， 即 使 是 数学 家 也 可 能 对 某 些 未 被 证 明 的 数学 定理 持 有 巨大 的 置 











信和 度 。 今 天 ， 绝 大 部 分 数论 学 家 相信 著名 的 黎 曼 假设 由 是 真 的 ， 许 多 人 认为 它 是 
数学 中 最 负 盛 名 的 未 解难 题 。 这 种 信念 是 如 此 强烈 ， 以 至 于 现在 有 大 量 定理 从 黎 





BRE TER 
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的 前 提出 发 ， 探 索 它 的 推论 。 











计算 机 科学 家 同样 对 P 26 NP 这 个 猜想 持 有 相当 高 的 置信 度 ， 很 多 人 认为 这 


个 猜想 是 





理论 计算 机 科学 中 最 负 盛 名 的 问题 。 即 使 这 样 的 置信 度 并 非 基 于 严谨 而 











无 可 争议 的 数学 证 明 ， 但 它 仍然 有 理 有 据 ， 特 别 是 在 贝 叶 斯 主义 的 看 法 中 。 如 果 


你 想 更 好 ] 




















地 理解 数学 家 对 未 被 证 明 的 数学 定理 的 置信 和 度 从 何 而 来 ， 我 只 能 推荐 你 





阅读 斯 科 特 ' 阿 伦 森 的 一 篇 优秀 博文 加。 实际 上 ， 阿 伦 森 对 P À NP 的 置信 度 是 如 
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此 巨大 ， 即 使 证 明 P=NP 或 类 似 结果 的 数学 论文 被 发 表 ， 对 其 置信 和 度 的 改变 也 非 
常 币 小 。 对 于 阿 伦 森 来 说 ， 更 可 能 发 生 的 情况 是 这 些 论文 有 问题 。 历 史 证 明 ， 他 
到 目前 为 止 都 是 对 的 一 一 这 只 会 加 强 他 对 了 A NP 的 置信 度 。 

同样 的 推理 对 更 受 争议 的 话题 也 成 立 。 在 2016 年 ， 美 国政 府 决 定 允 许 转基因 
蘑菇 不 经 过 测试 流程 即 可 商业 化 0。 这 一 决定 在 转基因 产品 名 声 不 好 的 欧洲 激 起 
了 大 量 反 对 声音 。 允 许 转 基因 产品 上 市 已 经 饱 受 争议 ， 而 不 经 过 测试 流程 似乎 更 
是 丑闻 ， 是 对 公共 健康 的 威胁 ! 

然而 ， 科 学 家 却 怀 着 喜悦 和 和 希 可 接受 了 这 一 消息 。 一 些 生物 学 研究 者 表示 : 
“研究 界 对 此 新 闻 感到 非常 满意 。” 这 些 研究 者 难道 不 是 在 扮演 疯狂 科学 家 ?他 们 
是 否 真正 意识 到 这 些 东 西 对 人 类 健康 的 潜在 威胁 ?他 们 难道 不 是 正在 创造 有 如 到 
兰 克 斯 坦 的 怪物 ? 
要 理解 这 些 科 学 家 的 观点 ， 最 简单 的 方法 就 是 带 着 (有 理 有 据 的 ) 偏见 去 思 
考 。 首 先 你 要 知道 ， 生 物体 中 的 基因 无 时 无 刻 不 在 改变 。 的 确 ， 在 每 次 繁衍 之 中 ， 
两 性 的 基因 会 重新 组 合 ， 构 成 一 条 新 的 DNA 链 ， 它 此 前 几乎 肯定 从 未 存在 过 。 除 
此 之 外 ，DNA 的 突变 也 会 不 断 累 积 ， 改 变 生物 体 的 基因 。 

在 自然 中 ， 紧 接着 发 生 的 就 是 自然 选择 这 一 现象 ， 它 更 青睐 某 些 与 其 他 个 体 
相 比 基因 有 所 改变 的 生物 。 农 业 中 也 有 类 似 的 现象 ， 它 被 称 为 人 工 选择 ， 跟 自然 
选择 一 样 更 青睐 某 些 个 体 。 被 人 类 驯化 的 物种 ， 无 论 是 动物 还 是 植物 ， 在 数 万 年 
的 时 间 内 经 受 着 这 样 的 人 工 选择 。 它 颠覆 了 这 些 被 选择 的 生物 ， 将 富有 侵略 性 的 
狼 转 变 为 温和 的 吉娃娃 ， 将 细小 、 难 吃 又 有 巨大 果 核 的 野生 香 巷 改良 成 了 我 们 每 
天 食用 的 香 兢 品种。 围绕 着 我 们 的 这 些 生 物 个 体 ， 与 数 十 个 世纪 之 前 相 比 ， 都 已 
经 在 基因 层面 上 发 生 了 改变 。 

但 这 还 不 是 全 部 ， 还 有 对 本 地 生物 多 样 性 的 改变 ,其 原因 包括 对 单一 品种 的 
大 规模 利用 、 对 来 自 地 球 另 一 端的 众多 物种 的 引进 、 对 农药 和 杀 虫 剂 的 大 规模 应 
用 ， 以 及 最 近 发 展 出 来 的 利用 紫外 线 辐 照 加 速 基因 突变 的 新 技术 。 

所 有 这 些 对 基因 组 的 改变 不 仅 迅 急 ， 而 且 缺 少 控制 。 被 改变 的 物种 面临 着 巨 
大 的 不 确定 性 。 正 是 这 些 因 素 让 纯粹 贝 叶 斯 主义 者 在 面 对 这 些 改变 对 人 体 健康 的 
潜在 危害 时 提出 先 验 的 疑问 一 一 即使 对 数 十 年 来 日 积 月 累 的 众多 科学 研究 进行 的 
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荟 茶 分 析 明 确 指 出 ， 转 基因 产品 对 公共 健康 来 说 并 不 比 传统 农业 更 危险 。 

但 自 2012 年 起 ， 生 物 研 究 者 发 现 了 一 种 编辑 生物 基因 组 的 全 新 方法 。 这 项 
技术 名 为 CRISPR Cas9， 能 够 逐 字 编辑 基因 组 。 换 名 话说 ， 它 能 让 我 们 确切 地 知 
道 基因 组 发 生 的 改动 。 这 样 一 来 ， 纯 粹 贝 叶 斯 主义 者 认为 ， 与 由 对 基因 组 改变 的 
控制 更 宽松 的 方法 得 到 的 其 他 农产品 相 比 ， 利 用 CRISPR Cas9 经 过 严格 控制 的 实 
验 流程 得 到 的 转基因 产品 于 先 验 而 言 更 可 靠 。 因 此 对 于 有 关 科 学 专家 来 说 ， 通 过 
CRISPR Cas9 得 到 的 转基因 产品 无 须 测试 即 可 被 批准 商业 化 这 一 消息 并 没有 引起 
什么 焦虑 。 转 基因 产品 比 利 用 传统 方法 得 到 的 品种 更 安全 ， 纯 粹 贝 叶 斯 主义 者 对 
此 抱 持 着 言 之 有 据 的 强烈 赞同 偏见 。 

无 论 是 转基因 产品 还 是 医学 诊断 ， 琳 达 问 题 还 是 法 庭审 判 ， 实 验 科 学 还 是 理 
论 科学 ,纯粹 贝 叶 斯 主义 者 在 思考 时 都 不 能 将 偏见 弃 之 不 顾 。 这 些 偏 见 就 是 她 的 
秘密 武器 ， 也 是 她 的 预测 能 成 功 的 原因 。 










































































贝 叶 斯 主义 者 对 万 物 均 有 偏见 


考虑 某 个 没 怎么 被 研究 过 的 假设 万 ， 它 与 我 们 几乎 没有 数据 的 事物 有 关 “。 我 
fr zs Hm? 与 其 冒 着 犯错 的 风险 ， 某 些 科学 家 断言 最 好 回答 “我 不 知道 ” 
或 者 “我 对 此 不 了 解 "。 某 些 贝 叶 斯 主义 者 会 进一步 说 ， 考 虑 所 谓 的 无 信息 先 验 分 
布 是 一 个 合理 的 选择 。 这 通常 是 一 个 均匀 分 布 ， 也 就 是 说 它 不 偏向 于 任 一 假设 。 
这 样 的 话 ， 无 论 互 正确 还 是 错误 ,假设 有 正确 的 先 验 概率 是 1/2 似乎 很 合理 , 或 
者 说 ， 应 该 向 其 赋予 1/2 的 先 验 置信 度 。 但 出 于 数 种 原因 ， 这 种 做 法 依 我 看 来 问题 
重重 。 
第 一 个 原因 是 最 本 质 的 。 这 种 立场 一 般 与 贝 叶 斯 主义 不 兼容 。 通 常 来 说 ， 即 
使 我 们 对 及 没有 和 多少 研 究 ， 它 也 与 我 们 研究 过 的 问题 、 收 集 数据 的 对 象 有 联系 。 































































































(D ZRT CRISPR Cas9 目前 还 有 一 定 的 “ 脱 靶 效应 ”， 即 错误 编辑 基因 组 的 其 他 地 方 的 情况 ， 但 
它 相 比 此 前 的 技术 大 有 进步 ， 目 前 研究 者 也 正在 探求 尽量 降低 脱 靶 效应 的 方法 ， 而 在 基因 编 
辑 后 对 编辑 后 的 生物 进行 测序 筛选 也 能 有 效 降 低 甚 至 消除 脱 靶 效应 的 影响 。 一 一 译 者 注 

D ”作为 参考 ， 你 可 以 将 恕 看 作 这 个 假设 : 大 爆炸 不 过 是 更 古老 宇宙 收缩 的 反弹 。 
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本 章 中 的 所 有 例子 都 典型 地 属于 这 个 情况 。 当 谈论 琳 达 问题 、 太 阳 、 审 判 、 阴 谋 
论 、 数 学 定理 或 转基因 产品 时 ， 我 们 手头 上 就 有 大 量 关 于 这 些 对 象 事 先 考 虑 到 的 
想法 和 数据 。 更 糟糕 的 是 ， 我 们 之 后 会 在 第 13 章 谈 到 的 斯 坦 悖 论证 明了 ， 对 知识 

的 割裂 (在 统计 学 意义 上 ) 是 不 可 容许 的 。 也 就 是 说 ， 对 于 贝 叶 斯 主义 者 (他 们 
的 思考 都 是 可 容许 的 ) 来 说 ， 即 使 过 去 经 历 的 对 象 表 面 上 与 HEURE, AH 
能 对 及 的 置信 和 度 毫 无 影响 。 因 此 ， 我 们 恰好 得 到 PCA] V1 = 1/2 的 可 能 性 就 微 乎 其 
微 了 。 

第 二 个 原因 出 于 动机 。 回 答 “ 我 不 知道 ”就 是 屈服 于 懒惰。 正如 庞 加 莱 所 说 : 

“怀疑 一 切 与 相信 一 切 是 两 种 同样 便利 的 解决 办 法 ， 二 者 都 让 我 们 免 于 思考 。” 特 
别 是 ， 对 先 验 概率 PA] 的 计算 精细 而 困难 ， 但 它 在 技术 上 不 过 是 计算 而 已 。 即 
使 我 们 不 是 能 够 瞬间 完成 这 种 计算 的 纯粹 贝 叶 斯 主义 者 ， 不 去 花 点 时 间 找 到 足够 
好 的 近似 似乎 也 不 合理 。 当 然 ， 不 要 忘记 这 种 启发 式 计算 只 不 过 是 粗略 的 近似 。 
要 注意 ， 近 似 的 有 效 性 有 可 能 被 纯粹 理论 化 的 论证 所 动 授 一 一 典型 的 论证 就 
是 证 明 某 些 被 忽略 的 计算 实际 上 对 近似 的 精度 有 着 巨大 的 影响 。 但 最 重要 的 是 ， 
为 了 找到 一 个 理由 来 进行 这 些 困 难 又 容易 出 错 的 计算 ， 我们 绝对 必须 先 说 服 自 己 ， 
“我 不 知道 ”这 个 回答 并 不 能 令 人 满意 。 
第 三 个 原因 关乎 教育 。 我 们 如 果 从 不 表露 偏见 ， 那 就 永远 不 会 暴露 出 错误 ， 
也 就 不 会 意识 到 我 们 的 无 知 中 以 及 无 意识 偏见 的 偏差 四。 要 对 抗 自 信 过 度 ， 
为 不 将 否定 自己 偏见 的 机 会 拒 之 门 外 似乎 更 可 取 。 与 其 说 “我 不 知道 ”"， 我 更 希望 
说 出 “我 可 能 搞 错 了 ， 但 我 敢 打 赌 ……”“ 我 有 个 幼稚 的 想法 ， 我 觉得 似乎 ……” 
或 者 “在 发 现 全 之前， 我 认为 ……” 之 类 的 话 。 明 确 说 出 自己 的 偏见 ， 也 能 帮助 
我 们 更 容易 明确 看 出 这 些 偏见 在 经 验 数 据 上 的 不 足 之 处 ， 也 就 更 容易 让 我 们 改变 
想法 ， 我 们 也 会 更 习惯 拥有 动态 变化 的 信念 。 学 习 是 一 支 舞 蹈 ， 那 我 们 就 一 起 起 
舞 吧 。 这 样 我 们 就 能 更 容易 地 识别 出 那些 可 以 合理 地 相信 自己 直觉 的 情况 ， 以 及 
与 之 相对 的 那些 直觉 不 怎么 可 靠 的 情况 。 在 这 些 情况 中 ， 我 们 也 更 容易 将 判断 交 
给 数学 模型 或 者 公认 的 权威 人 士 。 

第 四 个 原因 关乎 趣味 。 是 的 ， 因 为 发 现 自己 的 预测 正确 是 件 愉快 的 事情 一 一 
你 只 要 看 看 那些 明知 结果 却 还 在 重复 实验 的 物理 学 家 就 知道 了 。 但 更 重要 的 是 ， 
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发 现 某 种 很 有 说 服 力 的 直觉 实际 上 是 错误 的 ， 这 也 许 会 带 来 极致 的 快乐 中。 那些 
相信 探测 到 超 光 速 中 微 子 的 物理 学 家 "0 ， 还 有 那些 发 现 相 邻 素数 的 间隔 并 非 随机 
的 数学 家 “体验 到 的 正 是 这 一 点 ! 正如 伊 萨 克 ' 阿 西 莫 夫 所 说 :“ 科 学 中 最 激动 人 
心 的 话语 Cre ) 并 不 是 “我 发 现 了 ! ， 而 是 “这 有 点 怪 啊 ……”。” 没有 经 历 过 
发 现 反 直觉 事实 的 狂喜 ， 就 不 可 能 理解 为 什么 它 对 科学 家 来 说 是 生活 的 意义 。 然 
而 ,这 种 狂喜 的 关键 并 不 在 于 事实 违反 直觉 ， 而 是 在 于 非常 可 信 的 偏见 仍然 被 否 
AE To 

不 幸 的 是 ， 在 实际 生活 中 ,我 们 的 社会 环境 、 教 育 环 境 和 工作 环境 倾向 于 给 
错误 蒙 上 污 名 。 我 们 害怕 出 错 。 正 因 如 此 ,“ 我 不 知道 ”或 P[ 有 | 站 =1/2 就 成 了 如 
此 流行 的 逃避 方法 。 但 这 也 有 着 非常 严重 的 后 果 ， 特 别 是 在 数学 学 习 中 。 因 为 数 
学 是 最 容易 发 现 错误 的 领域 , 为 了 避免 任何 错误 ， 闭 上 嘴巴 不 表露 对 数学 猜想 的 
任何 偏见 就 成 了 诱 人 的 选择 。 更 糟糕 的 是 ， 这 让 很 多 人 在 数学 上 承受 着 某 种 “ 障 
碍 ”， 黄 至 到 了 “数学 焦虑 ”一 词 在 英语 版 维基 百科 上 拥有 自己 页 面 的 程度 。 这 种 
证 状 远 不 止 影响 到 那些 数学 “糟糕 ”的 人 ， 它 也 会 让 那些 太 害 怕 出 错 的 人 出 现 数 
学 能 力 下 降 的 现象 。 

与 之 相反 的 是 ， 我 预科 班 第 一 年 的 数学 老师 ， 也 就 是 让 我 发 现 数学 乐趣 的 人 ， 
在 评价 我 们 对 数学 问题 的 解释 时 ， 毫 不 犹 驳 地 说 出 “我 相信 ”或 者 “我 不 信 ” 这 
样 的 话 一 一 这 一 般 不 是 委婉 的 说 法 ! 对 我 来 说 ， 意 识 到 这 一 点 是 种 解放 。 我 们 可 
以 轻松 对 待 数 学 ， 打 赌 某 个 定理 是 否 正 确 ， 或 者 某 个 证 明 (想法 ) 是 否 可 行 ， 而 
这 也 意味 着 ,我 们 在 这 样 做 的 时 候 有 可 能 出 错 。 但 很 多 时 候 ， 犯 下 这 样 的 错误 是 
超 棒 的 00 ! 正 是 直觉 上 的 错误 让 直觉 本 身 得 以 进步 ， 观 察 到 数学 直觉 的 进步 也 同 
样 令 人 愉悦 ! 简 而 言 之 ， 比 起 其 他 领域 ， 在 数学 中 发 现 直 觉 上 的 错误 可 能 是 有 效 
而 正确 的 学 习 中 必 不 可 少 的 一 环 。 

但 这 种 对 错误 的 诈 歌 也 可 能 让 你 吃惊 甚至 陷入 困境 。 医 生 开 错 药方 或 者 切 开 
了 错误 的 血管 可 不 是 应 该 庆贺 的 事 。 同 样 ， 我 们 也 倾向 于 认为 ， 自 承 其 罪 的 政治 
家 不 配 得 到 更 高 的 职位 。 在 有 可 能 影响 深远 的 公开 发 言 中 ， 与 其 说 出 存在 问题 的 
发 言 ， 或 者 用 春 话 “污染 ”辩论 ， 表 态 “ 我 不 知道 ”似乎 是 正确 的 修辞 策略 ， 特 


D 我 们 会 在 第 14 章 再 谈 到 这 个 话题 。 
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别 是 ， 这 也 可 以 用 来 强调 相关 问题 有 多 困难 。 

此 言 非 虚 ,但 我 们 也 要 看 到 所 有 这 些 例子 中 都 存在 道德 (或 者 策略 ) 层面 的 
问题 。 然 而 贝 叶 斯 主义 并 非 道德 哲学 ， 所 以 对 于 什么 才 是 合乎 道德 的 行为 ， 或 者 
出 于 个 人 的 观点 应 该 怎么 做 ， 贝 叶 斯 主义 并 没有 什么 论述 。 贝 叶 斯 主义 是 一 种 知 
识 哲学 ， 它 的 目的 是 将 学 习 和 知识 组 织 起 来 ， 而 在 这 个 意义 上 ， 我 觉得 为 自身 的 
错误 而 庆祝 是 合适 的 。 

在 更 一 般 的 情况 下 ， 贝 叶 斯 主义 对 于 任何 事情 都 强制 要 求 进行 (概率 性 ) 预 
测 的 计算 “。 贝 叶 斯 主义 者 总 有 某 种 偏见 2, 不 能 说 出 “我 不 知道 "。 概 率 PLAIN] 必 
然 有 某 个 准确 值 ， 而 这 个 准确 值 基本 不 可 能 恰好 是 /2。 对 于 贝 叶 斯 主义 来 说 ， 深 
埋 这 种 偏见 是 非常 不 理性 的 行为 0, 










































































这 种 对 偏见 的 赞美 相当 惊人 。 毕 竞 在 日 常生 活 的 语言 中 ,“ 偏 见 ” 一 词 有 着 非 
负面 的 含义 ， 这 也 事 出 有 因 。 偏 见 似乎 会 不 可 避免 地 导致 各 种 不 平等 待遇 和 歧 
视 。 然 而 ， 我 们 需要 认识 到 ， 知 识 哲 学 与 知识 的 使 用 之 间 有 着 本 质 上 的 区 别 。 

在 探讨 这 个 关键 问题 之 前 ， 我 们 可 以 回忆 一 下 ， 许 多 偏见 是 非 贝 叶 斯 的 ， 意 
即 它们 并 不 是 通过 贝 叶 斯 公式 ( 的 近似 ) 得 到 的 。 其 中 大 量 偏见 甚至 与 概率 定理 
相悖 。 我 们 已 经 见识 过 了 ， 即 使 是 最 伟大 的 数学 家 也 有 无 法 正确 应 用 贝 叶 斯 公式 
的 时 候 ， 哪 怕 他 面 对 的 情况 相当 简单 。 我 们 的 偏见 都 没有 坚实 的 基础 ， 如 果 没 有 
花 上 长 时 间 思 索 偏见 的 来 源 的 话 就 更 是 如 此 。 

在 推理 中 反复 出 现 的 漏洞 之 一 就 是 贝 叶 斯 置信 和 度 语 境 的 缺失 。 比 如 说 ， 有 些 
有 影 和 电视 剧 展现 亚洲 人 不 会 开车 的 刻板 印象 。 好 笑 的 是 ， 人 们 居然 可 以 提 
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西方 




















D 蒂 博 ' 吉 罗 谈 到 了 所 谓 的 知识 论 赌局 ， 也 就 是 手枪 对 准 太阳 穴 的 赌局 。 我 们 可 以 犹豫 不 决 ， 
但 吉 罗 认为 ， 比 起 在 五 或 者 非 上 押 注 ， 抛 硬币 做 决定 更 不 理性 ， 除 非 我 们 已 经 精确 计算 出 
PIAM=1/2。 

@ HA, 贝 叶 斯 主义 者 对 这 种 偏见 的 可 靠 性 也 有 偏见 ， 特 别 是 面 对 专 家 的 偏见 ， 或 者 要 考虑 某 
个 仍 未 了 解 的 模型 时 。 
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出 理由 去 相信 这 种 刻板 印象 。 比 如 ， 在 有 些 亚洲 国家 ， 并 不 是 人 人 都 喜欢 驾驶 汽 
车 ， 因 为 那里 的 交通 十 分 拥挤 ， 骑 轻便 摩托 车 或 者 搭 公交 车 出 行 或 许 更 方便 。 所 以 ， 
比 起 汽车 至 上 的 美国 人 来 说 ， 认 为 亚洲 人 开车 没 那么 好 ， 似 乎 也 有 道理 。 然 而 ， 
如 果 考 虑 某 位 在 西方 国家 成 长 的 亚洲 人 比如 我 自己 )， 他 与 美国 人 的 驾驶 水 平 差 
距 就 远 远 没 那 么 明显 ， 其 至 基本 不 存在 。 没 有 语 境 和 质疑 ， 概 率 检验 就 出 问题 。 

同样 ， 任 职 于 瑞士 洛桑 、 纳 沙 泰 尔 和 日 内 瓦 等 地 大 学 的 犯罪 学 与 刑法 教授 安 
德 烈 . 库 恩 认为 ， 外 国人 的 犯罪 率 更 高 。 如 果 我 让 纯粹 贝 叶 斯 主义 者 考虑 一 位 法 
国人 和 一 位 外 国人 ， 她 对 这 位 外 国人 犯罪 的 置信 度 会 比 对 法 国人 犯罪 的 置信 度 稍 
微 高 一 点 。 然 而 ， 如 果 我 现在 告诉 她 ， 两 人 都 是 年 轻 男 性 ， 社 会 经 济 地 位 不 高 ， 
那么 安 德 烈 . 库 恩 表示 ， 纯 粹 贝 叶 斯 主义 者 现在 对 两 人 犯罪 的 置信 度 应 该 相仿 。 
实际 上 ， 纯 粹 贝 叶 斯 主义 者 对 外 国人 犯罪 的 置信 度 稍 微 更 高 的 原因 主要 是 ， 外 国 
人 年 轻 、 性 别 男 且 社会 经 济 地 位 不 高 的 概率 更 大 ， 这 正 是 犯罪 风险 的 三 个 主要 因 
素 。 然 而 ,一 旦 我 们 将 两 个 人 放 入 适当 的 语 境 ， 对 纯粹 贝 叶 斯 主义 者 来 说 ， 他 们 
到 底 是 法 国人 还 是 外 国人 ， 对 两 人 各 自 犯 罪 的 置信 度 的 影响 就 微不足道 了 [31。 

一 般 来 说 ， 我 们 更 喜欢 描述 、 发 表 和 阅读 类 似 “4 导致 B” 的 因果 关系 。 用 
概率 术语 来 说 ， 这 相当 于 说 P[B|4] 远 远 大 于 “P[B| 非 4]。 然 而 ,这 种 一 般 化 的 
说 法 一 般 来 说 并 不 适用 于 每 个 个 体 。 这 是 因为 每 个 个 体 4 都 有 各 种 各 样 的 特征 Z 
将 他 与 一 般 而 言 的 个 体 4 区 别 开 来 。 适 用 于 这 个 个 体 的 数值 就 不 是 PIJA], m 
是 PP[B|4, Z]。 然 而 ， 这 两 个 数值 可 能 天 差 地 别 。 典 型 的 例子 就 是 身体 质量 指数 
(BMI),， 它 可 以 用 于 有 效 地 描述 不 同 的 人 群 ， 但 是 它 对 于 特定 个 体 不 一 定 有 着 决 
定性 的 意义 中。 当然 ， 问题 在 于 对 Z 所 有 可 能 的 情况 列 出 对 应 的 IPLB|A, Z] 的 话 ， 
那 这 样 的 事情 就 登 不 上 报纸 头条 了 。 

更 糟糕 的 是 ， 这 种 因果 关系 在 实际 中 的 意义 可 能 相当 有 限 。 的 确 ， 通 常 最 有 
意义 的 问题 是 ， 如 果 某 个 人 2Z 去 做 某 事 4 的 话 ， 是 否 有 可 能 得 到 B。 然 而， 如 果 
将 “特地 去 做 4” 记 为 4 的话， 那么 4' 跟 4 并 不 是 一 回 事 。 举 个 经 典 例子 ， 进 行 
肌肉 锻炼 的 人 可 以 举 起 重 物 ,但 你 如 果 接 受 一 场 他 们 的 训练 ， 那 么 有 可 能 之 后 一 























































































































































































































CD ”我们 会 在 第 13 章 看 到 ， 这 并 不 完全 是 费 希 尔 认 为 “4 导致 8” 这 人 句 话 包含 的 意义 , 但 上 面 的 
批评 意见 对 于 费 希 尔 的 定义 仍然 适用 。 
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第 5 章 





段 时 间 什么 也 举 不 起 来 了 ! 所 以 ,要 对 个 体 Z 提 出 有 用 的 建议 ， 最 重要 的 数值 是 





P[BIZ. 4']， 而 不 是 PLBIZ. A]. "SERIE, XE PIB 
困难 得 多 ， 比 PIBA] 更 是 难 到 不 知 哪里 去 了 1! 











众多 





和 见 并 不 正 看 





























Z, A'] 的 估计 通常 要 比 p[B|Z, A] 











的 另 一 原因 ， 是 为 了 更 新 置信 度 而 进行 的 观察 结果 之 中 的 


偏差 。 这 本 质 上 还 是 语 境 的 问题 。 我 们 必须 意识 到 ， 这 些 观察 结果 同样 被 语 境 所 


Eb 

















影响 ， 而 且 也 许 并 不 能 代表 其 他 语 境 
个 数学 研究 者 的 时 候 ， 他 的 





怪 的 一 点 在 于 ， 人 们 对 数学 研究 者 最 普 ; 
如 我 在 纠正 他 时 说 的 那样 : "那些 老 数学 家 也 有 年 轻 的 时 候 。” 我 无 须 严格 的 证 明 就 





说 服 了 他 。 
然而 ， 过 分 短视 的 推 














、 对 次 要 特征 的 过 度 解 读 以 及 描述 














们 的 偏见 不 准确 的 成 千 上 万 个 原因 之 
知 的 认 知 偏差 ， 比 如 确认 偏差 、 
是 ,偏见 不 准确 
Eo 与 依赖 基于 贝 叶 斯 公式 的 计算 (1 
依赖 喜爱 与 敬佩 之 情 ， 


人 们 常常 指责 贝 叶 

































































斯 主义 者 ,说 








确 ， 对 于 任何 可 能 的 结论 ， 都 存在 可 以 





这 种 情感 来 自 尝 





[的 


认 知 失调 以 及 认 知 捷径 导致 的 
的 重要 原因 之 一 就 是 它们 通常 建立 在 口 耳 相传 而 不 是 经 验 数 据 之 
〖 怕 只 是 近似 ) 相 比 ， 我 们 的 置信 度 通常 更 
试 说 服 我 们 的 那些 人 的 魅力 、 修 辞 和 形象 。 
也 们 能 选择 不 同 偏见 来 扭曲 他 们 的 结论 。 的 


得 出 这 个 结论 的 偏见 。 我 愿意 承认 这 一 点 。 











在 各 执 一 词 的 疯狂 支持 者 之 间 的 辩论 








荐 你 看 看 修辞 、“ 标 题 党 ” 
学 





1， 他 们 唯一 的 目标 就 是 胜利 ， 而 贝 叶 
义 的 方法 的 确 难 以 辩护 。 如 果 你 的 目的 是 说 服 并 启 得 最 多 人 的 青睐 ， 我 会 首先 推 
和 挑 峡 的 艺术 中， 还 要 ( 几乎 ) 完全 忘记 一 切 知识 哲 





:类似 的 观察 结果 。 当 我 跟 一 位 导游 说 我 是 
回答 让 我 大 跌眼镜 :“ 但 是 …… 你 也 不 是 很 老 啊 ! ”很 奇 
的 印象 就 是 蓄 着 胡子 的 智者 。 然 而 ， 正 























的 偏差 ， 只 是 我 
还 有 其 他 广 为 人 
25. (EIS — TRU 





小 部 分 。 除 此 以 外 ， 



























































斯 主 








o 一 阶 逻 辑 并 不 能 让 你 收集 到 更 多 签名 或 者 拥有 更 多 话语 权 。 
在 对 经 济 效益 重大 的 企业 产品 进行 测试 〈 比 如 评测 、 撞 击 测试 或 者 质量 认证 ) 


时 ， 刚 才 的 问题 也 同样 关键 。 在 这 些 | 


HL 

















1， 人 们 更 青睐 简单 、 明 确 的 流程 。 然 


而 合适 的 偏见 通常 极端 复杂 ， 难 以 建 横 、 描 述 或 理解 。 不 季 的 是 ,测试 流程 的 可 























阐释 性 通常 与 贝 叶 斯 主义 的 基础 并 不 兼容 。 
昌 说 如 此 ， 如 果 在 交谈 时 ， 你 与 对 方 的 首要 目的 都 是 更 好 地 理解 这 个 世界 ， 
即使 这 可 能 要 用 到 你 不 喜欢 的 模型 ， 那 么 我 认为 一 开始 必须 做 的 就 是 明确 双方 的 
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[ay 








WIL, PAUL UE RER fin DATA RARE ie DL IE ETE, RENE 








贝 叶 斯 主义 时 ， 你 们 才能 稳步 前 进 
简 而 言 之 ,我 们 的 偏见 在 本 质 上 都 不 符合 贝 叶 斯 主义 ,但 错误 偏见 的 存在 绝 


























， 应 用 贝 叶 斯 公式 以 逐步 通 近 更 好 的 理论 。 























对 不 能 证 明 贝 叶 斯 式 偏见 并 非 必要 。 这 样 做 就 相当 于 因为 没有 人 能 理解 逆 否 命题 











而 弃 用 演绎 逻辑 。 





偏见 与 道德 





话 虽 如 此 ， 纯 粹 贝 叶 斯 主义 者 仍然 没有 排除 某 个 人 的 出 身 会 影响 其 生理 或 文 





化 特征 的 可 能 性 。 视 频 制 作 人 莱 奥 




















+ 格拉 塞 曾 这 样 断言 "9 :“ 正 如 自然 选择 的 情况 


会 根据 不 同 地 区 变化 一 样 ， 人 类 群体 之 间 的 基因 组 成 也 不 相同 。” 和 忽略 这 些 差异 在 














科学 上 也 就 站 不 住 脚 。 在 贝 叶 斯 的 意义 上 ， 认 为 个 体 的 遗传 与 社会 出 身 不 会 影响 








我 们 对 其 各 种 特征 、 能 力 与 习惯 的 置信 度 ， 这 种 想法 并 不 理性 。 














最 敏感 的 问题 并 不 是 差异 的 存在 ， 而 是 经 常 依附 于 不 同 遗 传 背景 的 道德 判断 。 





欧洲 白 种 人 消化 乳糖 的 能 力 比 亚 洲 
性 的 理由 。 至 于 智商 和 数学 学 习 的 平均 水 平 ， 与 之 相关 的 似乎 是 经 济 水 平 与 教育 





























1 人 更 好 ， 这 一 能 力 并 不 能 作为 社会 或 道德 优越 





质量 ， 而 不 是 我 们 的 基因 组 。 即 使 事实 并 非 如 此 ， 认 为 智商 更 高 证 明 地 位 优越 的 
想法 也 只 是 一 种 基于 道德 判断 的 社会 建构 。 作 为 知识 哲学 的 贝 叶 斯 主义 对 道德 判 





断 并 没有 什么 特别 的 看 法 。 














正 因为 道德 判断 和 伦理 如 此 关键 ， 我 们 在 本 书 的 最 后 一 章 仍 会 谈 到 这 些 话题 。 
对 于 被 称 为 效果 论 (consequentialism ) 的 规范 道德 哲学 来 说 ， 贝 叶 斯 主义 在 其 中 
扮演 了 无 可 替代 的 核心 角色 。 但 作为 本 章 的 结尾 ， 我 可 以 现在 就 强调 为 什么 展现 








来 的 。 让 我 举 一 个 最 显然 的 例子 : 





























自己 的 贝 叶 斯 置信 度 不 一 定 是 好 事 ， 即 使 这 些 置信 度 都 是 根据 贝 叶 斯 公式 计算 出 

















你 朋友 很 自豪 地 做 了 个 不 怎么 样 的 西式 饮 饼 ， 





但 你 不 必 告 诉 他 你 内 心 的 真实 想法 。 通 党 来 说 ， 如 果 谎 言 可 以 让 对 方 内 心 更 好 过 ， 





那么 这 种 “撒谎 ”就 是 合乎 道德 的 


昌 然 康德 和 他 的 信徒 不 会 同意 这 一 点 。 





关于 偏见 也 有 一 个 这 样 的 例子 ， 它 可 能 更 微妙 ， 但 同样 令 人 烦躁 甚至 伤 人 。 
当 我 还 小 的 时 候 ， 几 百人 的 学 校 里 只 有 两 个 亚洲 学 生 ， 我 就 是 其 中 之 一 ， 而 且 我 

















不 认识 另 一 个 亚洲 学 生 ! 当时 我 是 班 里 
评论 或 笑话 并 不 一 定 很 伤 人 一 一 虽然 被 
恼 的 地 方 在 于 ， 每 一 次 我 新 认识 一 个 孩 
种 先 人 之 见 。 我 总 是 受到 这 种 “优待 ” 
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最 矮 的 。 关 于 我 亚洲 人 身份 或 身高 问题 的 
人 起 外 号 不 是 什么 令 人 和 舒心 的 事 。 令 我 烦 
子 ， 这 个 孩子 就 会 在 我 面前 重复 对 我 的 种 














， 一 直 碰 到 相同 的 刻板 印象 。 正 是 这 种 反 反 





复 复 才 让 我 难以 忍受 。 不 ， 我 不 会 功夫 。 





花 一 年 改正 一 项 偏见 并 不 难 ， 这 就 




















是 那些 在 外 貌 上 没有 显著 特点 的 人 面 对 的 











情况 。 但 在 孤立 无 援 的 情况 下 ， 每 天 改正 同样 的 偏见 二 十 次 就 更 困难 、 更 累 人 ， 





也 更 令 人 不 快 。 不 过 ,我 的 尼泊尔 导游 





在 整整 十 五 天 里 一 次 又 一 次 地 向 其 他 尼 泊 


尔 人 解释 我 不 是 尼泊尔 人 ， 看 到 他 的 不 快 我 也 忍俊不禁 。 

















但 还 有 更 糟糕 的 ， 比 我 更 应 该 抱怨 
或 出 身 带 来 的 ( 也许 有 根据 的 ) 偏见 而 
请 援助 时 ， 这 个 问题 尤其 突出 。 各 种 激 

















的 大 有 人 在 。 有 些 人 经 常 由 于 他 们 的 外 貌 
处 于 劣势 。 在 求职 面试 、 司 法 审理 或 者 申 
励 措 施 与 它们 在 备 受 偏见 的 受害 者 身上 六 




















生 的 恶劣 后 果 ， 形 成 了 强烈 对 比 ， 我 们 之 后 在 探讨 博弈 论 时 会 再 谈论 这 个 问题 。 





为 了 避免 这 种 恶果 ， 建 立 适当 的 道德 哲 
章 再 次 讨论 这 个 话题 。 


与 技术 创新 一 样 ， 俩 见 有 好 有 坏 。 

















的 是 ， 俩 见 首先 对 于 思考 来 说 必 不 可 少 ， 
新 主义 者 来 说 ， 只 有 那些 运用 自身 偏见 的 人 ， 才 有 和 希望 达到 理性 。 


学 体系 必 不 可 少 。 我 们 会 在 本 书 的 最 后 一 


虽然 如 此 ， 我 在 上 文中 怎么 强调 也 不 为 过 
它 是 理性 思考 的 先决 条 件 。 对 纯粹 贝 叶 














( 贝 叶 斯 公式 ) 在 贝 叶 斯 生前 没有 任何 应 用 ， 
但 今天 ， 由 于 计算 机 的 出 现 ， 这 个 公式 被 日 
常 应 用 在 气候 变化 建 模 、 天 体 物 理学 与 金融 
市 场 分 析 中 。 

比尔 . 布 赖 森 (1951 一 ) 
在 每 个 非 贝 叶 斯 主义 者 心里 ， 都 有 一 名 贝 叶 
斯 主义 者 挣扎 着 想 获得 自由 。 

丹尼斯 林 德 利 (1923—2013 ) 


第 @@ 章 
贝 叶 斯 主义 的 “先知 ” 


一 段 起 伏 跌宕 的 历史 








在 很 长 一 段 时 间 里 ， 频 率 主义 者 及 其 精神 领袖 罗 纳 德 . 费 希 尔 都 在 迫害 一 批 
人 ， 在 他 们 眼中 那 只 是 一 个 默默 无 名 的 小 学 派 。 整 整 两 个 世纪 ， 贝 叶 斯 主义 寥寥 
可 数 的 几 个 忠实 信徒 必须 秘密 行动 ， 他 们 不 敢 公 开 承 认 自 己 的 异端 信念 。 被 频率 
主义 禁止 之 后 ， 贝 叶 斯 主义 有 几 次 甚至 被 通 到 了 灭绝 的 边缘 。 

但 依靠 普 赖 斯 和 拉 普 拉 斯 的 古老 典籍 ， 一 小 群 虔诚 的 使 徒 守住 了 贝 叶 斯 主义 
的 明灯 。 这 些 贝 叶 斯 主义 的 先知 知道 如 何 将 贝 叶 斯 的 信条 应 用 到 现代 社会 中 ,无 
论 是 金融 、 工 程 还 是 科学 领域 。 当 今 ， 一 些 著名 大 学 甚至 开始 每 周 举办 集会 ， 邀 
请 那些 信徒 与 见习 者 反 反 复 复 阅 读 贝 叶 斯 的 舱 言 。 现 在 ， 人 们 对 贝 叶 斯 主义 的 态 
度 产 生 了 如 此 大 的 改变 ， 即 使 是 在 学 术 圈 ， 承 认 自己 是 贝 叶 斯 主义 者 也 不 再 不 可 
理喻 一 一 虽然 当 我 为 贝 叶 斯 主义 辩护 时 ， 仍 然 经 常 有 人 向 我 投 以 怀疑 的 眼光 。 

我 花 这 个 时 间 构 建 这 个 隐喻 ， 是 因为 贝 叶 斯 主义 的 历史 本 里 就 很 激动 人 心 ， 
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也 代表 着 科学 史 的 特点 。 与 人 们 通常 的 叙事 相反 ， 科 学 并 不 只 是 一 系列 智者 的 灵 
光一 现 与 理性 的 胜利 。 在 思想 的 演进 中 ， 滥 权 、 嫉 妒 与 对 抗 扮 演 着 同样 重要 的 角 
色 。 数 个 世纪 以 来 被 最 优秀 的 智者 否定 的 想法 ， 最 后 也 可 能 会 被 科学 共同 体 接受 。 

据 作家 水 伦 . 麦 格雷 恩 所 说 ， 这 正 是 贝 叶 斯 主义 的 遭遇 。 麦 格雷 恩 甚 至 为 贝 
叶 斯 主义 那 难以 置信 的 历史 写 了 整整 一 本 书 ， 并 日 不 属于 给 它 起 了 这 样 一 个 标题 : 
《 死 不 掉 的 理论 : 贝 叶 斯 法 则 如 何 破译 恩 尼 格 玛 密码 、 追 踪 发 现 俄罗斯 潜艇 并 赢得 
一 场 两 个 世纪 的 论 成 》( The Theory that would not Die: How Bayes’ Rule Cracked the 





































































































Enigma Code, Hunted down Russian Submarines, and Emerged Triumphant from two 
Centuries of Controversy ). 

在 本 章 中 ,我 提议 大 家 一 起 探索 贝 叶 斯 主义 那曲 折 动 人 的 历史 。 为 此 ， 讲 一 
点 关于 17 世纪 的 闲话 很 有 好 处 ， 那 正 是 布 莱 兹 .帕斯卡 和 皮 埃 尔 : 德 . 费 马 终于 
尝试 将 概率 这 个 概念 数学 化 的 时 代 。 









































概率 论 的 起 源 

















由 斯 卡 和 费 马 当时 考虑 的 问题 ， 就 是 当 纯 粹 靠 运气 的 赌局 中 断 之 后 ， 怎 么 根 
据 当 前 的 比分 来 分 配 赌 金 。 比 如 说 ， 想 象 一 下 两 位 玩家 各 自 赌 上 10 欧元 ， 进 行 一 
盘 抛 11 次 均匀 硬币 然后 比较 正 反面 出 现 次 数 的 胜 负 。 押 注 在 次 数 较 多 〈 即 出 现 6 
次 或 以 上 ) 那 一 边 的 玩家 就 能 把 赌 上 的 全 部 20 欧元 收入 守 中 。 假 设 在 赌局 因 事 中 
断 时 ， 比 分 是 4-0， 那 么 应 该 如 何 公平 地 划分 赌 金 ? 

从 直觉 上 来 说 ，4-0 领先 的 那 一 方 应 该 分 到 更 多 的 赌 金 ， 因 为 他 最 后 获胜 的 概 
率 更 大 。 但 他 应 该 获得 其 中 几 分 之 几 ? 为 了 得 到 严谨 的 答案 ,帕斯卡 和 费 马 需 要 
确立 一 种 方法 来 传播 每 一 次 抛 硬币 的 不 确定 性 。 换 句 话 说 ， 他 们 知道 了 原因 一 一 
赌局 不 确定 性 ( 也 就 是 每 一 次 抛 硬币 的 不 确定 性 )， 需要 由 此 确定 结果 一 一 两 位 玩 
家 最 终 获胜 的 概率 。 帕 斯 卡 和 费 马 需要 构建 一 套 关 于 概率 的 演绎 逻辑 。 这 让 他 们 
黄 定 了 概率 论 的 基础 ， 还 引入 了 数学 期 望 和 二 项 分 布 等 概念 。 

但 帕斯卡 和 费 马 的 理论 仍然 很 不 完善 。 真 正 赋予 概率 论 血 肉 的 人 ， 可 能 是 3 
伯 拉 罕 ' 棣 莫 弗 。 在 17 世纪 末 ， 棣 莫 弗 因 人 宗教 迫害 逃离 法 国 ， 在 英国 皇家 学 会 这 
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个 充满 智 识 的 环境 中 受到 了 庇护 ， 而 且 可 以 与 艾 萨 克 FU. £988 - 沃 利 斯 和 约 
WA 洛克 等 人 共处 。 在 那里 ， 他 发 表 了 题 为 《机 会 论 》( The Doctrine of Chances ) 
的 开创 性 著作 。 该 书 初步 概述 了 数学 中 最 漂亮 的 定理 之 一 一 一 中 心 极限 定理 。 用 
这 个 定理 可 以 推断 出 ， 如 果 将 无 数 个 微小 的 独立 随机 扰动 加 起 来 ， 得 到 的 随机 变 
量 遵循 怎样 的 概率 分 布 。 























神秘 的 托马斯 贝 叶 斯 











然而 ， 概 率 论 中 还 有 一 个 问题 ， 棣 莫 弗 不 知道 如 何 解决 ， 该 问题 回应 了 大 
卫 ，… 休 议 的 哲学 思考 ， 我 们 在 第 4 章 就 已 经 谈 到 过 这 位 早 于 棣 莫 弗 出 现 的 哲学 家 。 
这 个 基础 性 问题 叫 作 逆 概率 问题 ， 但 它 其 实 就 是 关于 归纳 的 问题 ， 也 就 是 在 已 知 
结果 的 前 提 下 计算 不 同 原 因 的 概率 。 

这 就 是 加 尔 文宗 的 教会 牧师 托马斯 ， 贝 叶 斯 出 场 的 时 候 了 。 好 数学 家 磁 到 难题 
时 就 会 做 ， 贝 叶 斯 首先 考虑 了 一 个 简单 的 例子 。 他 想象 有 一 张 桌子 ， 上 面 (均匀 ) RÉ 
机 地 放 着 一 个 和 白 球 ， 而 贝 叶 斯 本 人 背 向 桌子 ， 对 白 球 位置 一 无 所 知 。 然 后 ， 贝 叶 斯 
必须 从 白 球 位 置 引 出 的 结果 出 发 ， 判 定 这 个 位 置 ， 或 者 至 少 给 出 对 应 的 可 能 性 

贝 叶 斯 的 助手 会 将 一 个 黑 球 放 在 桌面 上 ,位 置 同样 (均匀 ) 随机 。 贝 叶 斯 仍 
然 背 对 桌子 ， 同 样 不 知道 黑 球 的 位 置 。 接 下 来 ， 贝 叶 斯 向 助手 提问 白 球 到 底 在 黑 
球 的 左边 还 是 右边 ， 助 手 会 回答 他 的 问题 。 然 后 ， 这 位 助手 会 用 第 二 个 黑 球 重复 
同样 的 步骤 ,告诉 贝 叶 斯 这 个 新 的 黑 球 到 底 在 白 球 的 左边 还 是 右边 ， 然 后 重复 第 
三 个 、 第 四 个 黑 球 ， 以 此 类 推 。 

如 果 知 道 白 球 位 置 的 话 ， 贝 叶 斯 就 可 以 计算 助手 的 每 个 答案 的 概率 。 所 以 白 
球 位 置 应 该 是 助手 对 贝 叶 斯 的 提问 做 出 那些 回答 的 原因 (之 一 )。 首 概率 问题 就 
在 已 知 结果 的 情况 下 确定 原因 ， 也 就 是 在 已 知 助手 的 回答 的 情况 下 ， 确 定 白 球 的 
可 能 位 置 。 你 可 能 也 猜 到 了 ， 贝 叶 斯 正 是 通过 直觉 ， 得 到 了 以 他 的 名 字 命 名 的 公 
式 ， 从 而 解决 了 确定 白 球 (可 能 ) 位 置 这 个 问题 。 

你 可 能 会 觉得 ， 这 样 就 终结 了 逆 概 率 的 问题 。 事 实 远 非 如 此 。 正 如 本 章 中 将 
会 谈 到 的 众多 统计 学 家 那样 ， 贝 叶 斯 行事 隐秘 ， 没 有 发 表 他 的 神奇 公式 。 他 是 不 
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是 害怕 引起 论 成 ?这 似乎 不 太 可 能 。 他 在 世 时 曾经 挺身 反对 乔治 ， 伯克利 对 牛顿 
建立 的 新 数学 体系 的 批评 凸 。 他 是 不 是 害怕 质疑 自己 的 宗教 信仰 ? 肯定 不 是 ， 因 
为 他 发 展 逆 概 率 理论 的 重要 目的 就 是 强调 原因 这 个 概念 ， 而 原因 可 以 追溯 到 所 谓 
的 第 一 因 ， 从 而 证 明 上 帝 的 存在 。 

为 什么 贝 叶 斯 没有 发 表 他 的 公式 ? 最 可 信 的 解释 之 一 很 简单 ， 就 是 他 没有 看 
到 他 这 个 公式 全 部 的 美 ， 或 者 自己 也 不 相信 这 种 美 。 无 论 如 何 ， 不 少 专家 赞同 ， 
贝 叶 斯 很 可 能 不 是 贝 叶 斯 主义 者 。 

1763 年 ， 在 贝 叶 斯 辞世 两 年 之 后 ， 他 的 公式 才 最 终 得 以 发 表 ， 这 要 归功 于 理 
查 德 . 普 赖 斯 的 不 朽 之 作 。 实 际 上 ， 在 这 两 位 吞 者 之 中 ， 普 赖 斯 反而 比 贝 叶 斯 更 
像 一 个 贝 叶 斯 主义 者 ， 但 他 其 实 也 没有 那么 秉持 贝 叶 斯 主义 。 另 外 ， 他 同意 投入 
出 版 贝 叶 斯 遗 作 这 一 工作 ， 动 机 似乎 是 为 了 证 明 上 帝 的 存在 。 普 赖 斯 这 样 断言 : 
“我 的 目标 就 是 弄 清 我 们 究 竞 出 于 什么 原因 相信 ， 物 体 的 组 成 中 存在 一 些 固定 法 
则 ， 而 这 些 法 则 正 是 物体 产生 的 依据 ; 我 们 又 为 何 会 相信 ， 世 界 的 框架 也 因此 必 
然 源 自 一 个 智能 本 因 的 智慧 和 能 力 。 所 以 ，( 我 的 目标 就 是 ) 通过 终极 原因 确立 上 
帝 的 存在 。 



















































































































































































拉 普 拉 斯 ， 贝 叶 斯 主义 之 父 














实际 上 ， 称 得 上 贝 叶 斯 主义 者 第 一 人 的 并 不 是 英国 人 ， 而 是 法 国人 皮 埃 尔 - 
西蒙 ' 拉 普 拉 斯 。 拉 普 拉 斯 是 历史 上 最 伟大 的 数学 家 之 一 ， 他 大 概 也 是 我 心目 中 
最 伟大 的 英雄 。 长 久 以 来 ， 他 为 人 们 所 熟知 的 原因 是 他 对 分 析 及 其 在 天 文学 中 
的 应 用 所 做 的 工作 ， 他 将 这 些 工作 成 果 集 结 成 五 卷 题 为 《天 体力 学 》( Traité de 
mécanique céleste) 的 著作 并 发 表 。 特 别 是 ， 这 本 巨著 给 出 了 关于 太阳 系 稳定 性 问 
题 的 新 解答 。 牛 顿 此 前 已 经 证 明了 ， 如 果 宇 宙 中 只 有 地 球 和 太阳 ,那么 它们 就 会 
组 成 一 个 稳定 的 系统 ， 直 到 时 间 的 尽头 。 然 而 ， 如 果 这 个 模型 必须 包括 木星 的 话 ， 
那么 相应 的 方程 就 无 法 求解 。 牛 顿 最 后 举 手 投 降 ， 得 出 的 结论 是 只 有 上 帝 的 干预 
才能 给 予 这 个 复杂 系统 秩序 ， 将 行星 的 轨道 稳定 下 来 。 

装备 上 以 他 自己 的 名 字 命 名 的 “ 拉 普 拉 斯 变换 ”等 新 数学 分 析 工 具 之 后 ， 拉 
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普 拉 斯 成 功 给 出 了 太阳 系 其 实 无 须 上 帝 的 干预 也 很 稳定 的 理由 。 拿 破 仑 ， 


在 阅读 了 拉 普 拉 斯 的 《天 体力 学 》 之 后 ， 





我 看 了 你 的 书 ， 这 个 名 词 在 里 本 











要 上 帝 这 个 假设 。 

















然而 ， 拉 普 拉 斯 并 没有 完全 严谨 地 解决 太阳 系 稳 





波 拿 巴 


问 了 一 句 :“ 牛 顿 在 他 的 书 里 谈 到 了 上 帝 。 











i 一 次 都 没有 出 现 过 。” 拉 普 拉 斯 的 回答 是 : 








责怪 他 。 之 后 一 代 又 一 代数 学 家 在 这 个 难得 超出 想象 的 问题 上 克 兢 绊 绊 ， 














HE RAR + 弗 里 德里 希 ' 高 斯 、 享 利 ， 
































PELARE. ESR, 


斯 卡尔 和 塞 德 里 克 ' 维 拉 尼 。 正 如 庞 加 莱 在 他 自己 的 一 篇 本 应 
性 的 论文 中 找 出 了 错误 那样 ， 数 学 界 与 天 体 物 理学 界 对 于 太阳 系 稳 定 怡 


定性 的 问题 ， 而 我 们 绝 不 能 


其 中 包 


庞 加 莱 、 安 德 烈 . 柯 尔 莫 哥 洛 夫 、 和 雅克 du 











雅克 ' 拉 


些 模 拟 预 言 : 太阳 系 将 在 很 长 一 段 时 


还 需要 相当 长 的 时 间 。 














拉 普 拉 斯 在 解决 这 个 问题 时 遇 到 的 困难 之 一 就 是 手 涉 上 的 观察 结果 不 够 准确 。 
需要 说 明 一 下 ， 这 些 数据 来 自 公 元 1000 年 左右 的 阿拉 伯 人 、 























公元 100 年 左右 的 古 


证 明了 太阳 系 稳定 
E 的 置信 和 度 


à 


斯 卡尔 的 模拟 似乎 获得 了 科学 界 的 肯定 。 这 
期 内 变 得 不 稳定 。 但 请 放心 ， 要 看 到 这 一 天 





























罗马 人 、 公 元 前 200 年 的 古 希 腊 人 ， 其 至 公元 前 1100 年 的 中 国人 。 但 不 巧 的 是 











当时 的 测量 仪器 都 不 够 精确 。 





拉 普 拉 




















探索 这 些 含有 错误 的 数据 的 呢 ? 
拉 普 拉 斯 着 手 研究 这 个 问题 的 角度 也 是 典型 贝 叶 斯 式 的 。 他 知道 此 前 数 个 


























斯 的 发 现 的 风声 ， 拉 普 拉 














斯 手头 的 数据 是 错误 的 ， 但 他 是 怎样 





















































公式 。 














进攻 了 这 个 道 概率 问题 。1774 年 ， 














还 能 够 


世纪 天 文学 家 的 观察 结果 ， 而 且 需 要 从 中 推断 错误 的 原因 一 一 天 体 在 天 空中 真 
正 的 位 置 。 在 意识 到 这 个 问题 的 结构 之 后 ， 即 使 他 当时 似乎 还 没有 听 到 有 关 贝 叶 
斯 还 是 正面 i 
斯 发 表 了 《 论 事件 原因 存在 的 概率 》( Mémoire sur la probabilité des causes par les 
événements )。 这 是 多 么 出 色 的 文章 ! 他 在 论文 中 结合 了 棣 莫 弗 之 前 的 工作 、 拉 格 
朗 日 创造 的 分 析 工 具 以 及 他 本 人 的 才华 ， 以 最 广泛 、 最 壮丽 的 方式 确立 了 贝 叶 斯 


ji 














拉 普 拉 斯 的 兴趣 并 不 止 于 天 文学 。 在 之 后 的 岁月 里 ,他 将 想法 发 表 在 了 两 部 


著作 中 。 在 书 中 ， 他 将 数学 延伸 到 了 通常 的 应 用 领域 以 外 。 拉 普 拉 
然 科学 之 外 ， 还 可 以 应 用 到 社会 科学 、 


除了 可 以 将 他 的 概率 理论 应 


应 用 到 天 文学 等 自 

















斯 还 特别 提出 ， 
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目击 证 词 、 医 学 检验 、 法 庭审 判 、 人 口 普查 等 许多 其 他 问题 上 。 拉 普 拉 斯 还 亲自 
利用 自己 的 新 理论 来 研究 新 生 儿 的 性 别 ， 这 让 他 以 很 高 的 置信 和 度 得 出 了 结论 : 新 
生 儿 更 可 能 是 男孩 而 不 是 女孩 。 

对 拉 普 拉 斯 来 说 ， 概 率 推理 不 过 是 常识 的 数学 化 。 他 肯定 将 贝 叶 斯 公式 看 成 
思考 的 正确 方式 。 然 而 ， 他 也 意识 到 同时 代 的 人 在 应 用 这 个 公式 时 会 重复 犯 下 革 
些 错误 。 与 他 同时 代 的 人 的 “常识 ”被 廖 论 侵蚀 了 。 因 此 ， 拉 普 拉 斯 的 车 作 中 有 
一 部 分 可 以 被 看 成 认 知 科学 的 萌芽 。 

在 他 生命 最 后 的 时 光 中 ， 拉 普 拉 斯 同样 发 展 了 非 贝 叶 斯 式 的 统计 方法 ， 它 们 
特别 依靠 于 他 证 明 的 中 心 极 限定 理 。 所 以 拉 普 拉 斯 也 理解 ， 对 于 足够 大 的 数据 集 
来 说 ， 这 种 频率 主义 式 的 做 法 等 价 于 贝 叶 斯 主义 式 的 做 法 。 出 于 处 理 大 量 数据 时 
的 便利 性 ， 拉 普 拉 斯 最 终 更 倾向 于 在 众多 实践 事例 中 利用 非 贝 叶 斯 式 的 方法 。 拉 
普 拉 斯 是 一 位 实用 贝 叶 斯 主义 者 。 
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拉 普 拉 斯 接续 法 则 




















现在 我 们 先 讨 论 拉 普 拉 斯 1774 年 的 文章 中 最 巧妙 的 计算 之 一 。 为 了 展示 他 关 
BRAIN, HAE LA TN, HART, EURE 
和 黑色 纸 条 。 这 个 例子 实际 上 与 贝 叶 斯 提出 的 那个 问题 非常 相似 一 一 学 数学 的 人 
会 说 ， 这 两 个 问题 是 同 构 的 。 假 设 钢 中 白色 纸 条 的 比例 是 未 知 的 ， 拉 普 拉 斯 从 镀 
中 随机 抽取 了 一 张 纸 条 “， 那 张 纸 条 是 白色 的 。 我 们 可 以 对 镀 中 白色 纸 条 的 比例 有 
什么 想法 ?如 何 解 释 抽 取 的 纸 条 是 白色 的 ?抽出 一 张 白色 纸 条 的 原因 是 什么 ? 

频率 主义 的 斗士 费 希 尔 很 可 能 就 会 举 手 投 降 ， 说 这 个 问题 毫 无 意义 。 对 费 希 
尔 来 说 ， 这 是 一 个 非 统 计 学 、 非 科学 的 问题 ， 其 至 是 一 个 没有 意义 的 问题 。 

拉 普 拉 斯 可 不 这 样 想 ， 他 提出 了 一 个 聪明 的 想法 ， 就 是 以 抽 纸 条 之 前 对 白色 
纸 条 的 比例 的 偏见 为 出 发 点 。 拉 普 拉 斯 进行 了 先 验 的 假设 ,认为 白色 纸 条 的 比例 
是 0 和 1 之 间 的 一 个 (均匀 分 布 的 ) 随机 数 。 要 注意 到 ， 拉 普 拉 斯 的 这 一 随机 变 























































































































CD 根据 下 文 ， 这 里 抽取 出 的 纸 条 应 该 放 回 铀 子 ， 以 保持 白色 纸 条 的 比例 不 变 。 一 一 译 者 注 
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量 并 不 代表 真实 的 不 确定 性 ， 而 是 代表 了 他 ( 主观 上 的 ) 无 知 。 

无 论 如 何 ， 拉 普 拉 斯 之 后 进行 了 贝 叶 斯 式 的 推理 ， 目 的 是 根据 抽出 纸 条 的 颜 
色 来 更 新 他 的 偏见 。 在 应 用 贝 叶 斯 公式 (其实 是 拉 普 拉 斯 自己 的 公式 ) 之 后 ， 拉 
普 拉 斯 得 出 了 这 样 的 结论 : 白色 纸 条 的 后 验 比例 仍然 是 一 个 在 0 和 1 之 间 的 随机 
数 。 但 如 果 要 预测 从 键 中 抽出 的 下 一 张 纸 条 的 颜色 ， 那 么 他 会 向 白色 这 个 可 能 1 
赋予 2/3 的 概率 。 

在 更 一 般 的 情况 下 ， 如 果 之 前 已 经 抽取 出 p 张 白 纸 条 和 g 张 黑 纸 条 的 话 ， 对 
于 下 一 张 从 负 中 抽出 的 纸 条 ， 拉 普 拉 斯 会 向 “ 它 是 白色 的 ”这 个 可 能 性 赋予 
(p+1)/(p+q+2) 的 概率 。 这 就 是 拉 普 拉 斯 接续 法 则 ， 可 以 由 贝 叶 斯 公式 推导 出 来 。 

不 巧 的 是 ， 我 在 本 书 中 无 法 展开 叙述 拉 普 拉 斯 的 贝 叶 斯 式 计算 需要 的 分 析 工 具 ， 
但 我 强烈 建议 有 兴趣 的 人 去 看 看 他 写 于 1774 年 的 那 篇 文章 第 30 页 中 的 问题 1， 该 
文章 可 以 在 互联 网 上 免费 获取 。 

拉 普 拉 斯 的 天 才 之 处 在 于 结合 了 两 种 随机 性 : 抽取 纸 条 的 随机 性 ， 以 及 为 拉 
普 拉 斯 对 白色 纸 条 比例 的 无 知 而 建 模 的 随机 性 。 如 果 与 拉 普 拉 斯 同时 代 的 人 肯 花 
时 间 理 解 他 对 这 个 问题 的 解答 中 的 精妙 之 处 ， 科 学 与 科学 哲学 的 历史 可 能 会 出 现 
又 一 个 转折 点 。 
比如 说 ， 拉 普 拉 斯 的 接续 法 则 使 他 最 终 能 回答 休 资 的 问题 : 已 知 连续 j 天 太阳 
照常 升 起， 我们 能 否 相 信和 明天 太阳 仍 会 升 起 ? 

如 果 把 每 一 天 看 成 一 张 纸 条 ， 黑 色 纸 条 对 应 太阳 升 起 ， 白 色 纸 条 对 应 太阳 没 
有 升 起 ， 那 么 有 p=0 以 及 gq=j。 所 以 ,假如 应 用 拉 普 拉 斯 的 贝 叶 斯 理论 的 话 ， 我 
们 就 可 以 根据 这 些 数据 预言 明天 太阳 不 会 升 起 的 概率 等 于 1/(j+2)。 

拉 善 拉 斯 援引 《圣经 》 选择 了 相当 于 5000 年 的 天 数 作 为 7 值 ， 这 让 他 得 出 明 
天 太阳 不 会 升 起 的 概率 大 概 是 一 百 万 分 之 一 。 面 对 这 个 荒唐 的 结果 ， 拉 普 拉 斯 立 
刻 补充 道 : “考虑 到 在 世界 万 事 中 存在 司 掌 尽 夜 与 季节 的 原则 ， 且 尚 没 有 任何 事物 
能 阻碍 其 运转 ， 这 个 数目 (一 百 万 分 之 一 ) 还 是 太 大 了 。” 贝 叶 斯 主义 者 在 细 化 预 
测 结果 时 ， 应 该 考虑 自己 的 所 有 知识 。 

不 巧 的 是 ， 尽 管 写 出 了 这 样 的 评注 ， 拉 普 拉 斯 的 预测 仍然 引 来 了 暴风 又 雨 般 
的 批评 。 这 个 预测 惹 来 了 一 遍 又 一 饥 的 嘲笑 ， 这 让 很 多 人 对 拉 善 拉 斯 的 概率 理论 
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哈 之 以 盟 。 拉 普 拉 斯 这 个 不 坟 的 预测 可 能 是 贝 叶 斯 主义 在 之 后 两 个 世纪 式微 的 主要 原 

因 。 然 而 奇怪 的 是 ， 依 照 现 在 的 知识 来 看 ， 拉 普 拉 斯 的 公式 实际 上 准确 得 惊人 ! 
首先 ， 我 们 必须 修正 拉 普 拉 斯 的 j 值 。 今 天 ， 我 们 知道 了 太阳 每 天 升 起 已 经 持 

续 了 大 约 50 亿 年 。 这 样 的 话 ， 拉 普 拉 斯 的 公式 就 告诉 我 们 ， 太 阳 明 天 不 会 升 起 的 

































































概率 大 概 是 两 万 亿 分 之 一 。 特 别 是 ,我 们 其 实 也 预测 了 太阳 在 数 十 亿 年 后 就 不 会 














再 升 起 了 。 然 而 令 人 侯 有 兴味 的 是 ， 天 体 物理 学 家 今天 也 告诉 我 们 ， 太 阳 在 50 亿 





年 后 会 变 成 红 巨 星 ， 膨 胀 到 把 地 球 吞噬 。 即 使 并 非 出 于 太阳 向 红 巨 星 转 变 的 原因 ， 


拉 斯 卡尔 的 模拟 也 指出 





， 地 球 这 颗 蓝 色 行 星 最 终 会 在 数 十 亿 年 后 脱离 轨道 。 真 是 











不 可 思议 ! 现代 物理 学 给 了 我 们 两 个 认为 拉 普 拉 斯 的 预测 正确 的 理由 ! 


有 人 可 能 认为 这 是 























一 个 无 法 解释 的 神奇 巧合 。 这 毋庸 置疑 就 是 运气 ， 因 为 拉 








普 拉 斯 的 预测 本 质 上 是 概率 性 的 一 一 什么 都 可 能 发 生 ! 另外 ， 如 果 将 同样 的 推理 








应 用 到 宇宙 未 来 是 否 会 


消失 这 个 问题 上 ， 那 么 最 终 似 乎 会 失败 "。 雪 上 加 霜 的 是 ， 











我 在 这 里 的 阐释 也 不 完全 符合 贝 叶 斯 主义 ”。 然 而 ， 这 个 巧合 其 实 并 不 像 人 们 朴素 


的 想象 那么 神奇 。 想 象 一 下 ， 我 们 现在 希望 根据 某 人 的 年 龄 预测 他 的 寿命 。 拉 普 





























拉 斯 的 方法 “得 出 的 预测 就 是 ， 这 个 人 接 下 来 还 能 活 上 和 他 目前 年 龄 一 样 的 年 数 。 





当然 ， 如 果 这 个 人 是 新 





生 儿 或 老人 ,那么 这 种 预测 就 很 有 问题 了 。 然 而 ， 这 不 太 








可 能 发 生 。 在 绝 大 部 分 情况 下 ， 我 们 磁 到 的 是 20 岁 和 60 岁 之 间 的 人 ， 由 此 预测 
的 人 类 寿命 大 概 在 40 岁 和 120 岁 之 间 。 
更 妙 的 是 , 假设 人 类 寿命 等 于 100 岁 ， 而 各 年 龄 段 在 总 人 口中 的 占 比 不 相 上 下 ， 











D 考 德 威 尔 、 卡 米 翁 科 夫 斯 基 和 温 伯 格 在 2003 年 的 一 篇 题 为 《幻影 能 量 与 宇宙 末日 》(“Phantom 
Energy and Cosmic Doomsday" ) 的 论文 中 ,正好 预言 了 我 们 的 宇宙 在 22 亿 年 后 会 发 生 “ 大 括 




















裂 "， 这 再 次 符合 了 拉 普 拉 斯 的 预测 ! 








© 这 里 涉及 的 是 后 验 平 均值 ， 也 就 是 说 ， 所 有 对 未 来 的 预测 都 基于 平均 后 验 概率 。 与 之 相对 ， 





纯粹 贝 叶 斯 主义 者 会 将 
寿命 的 数学 期 望 无 限 大 
置信 度 。 这 样 的 话 ， 纯 

















级 。 用 数学 语言 来 说 ， 


























所 有 关于 太阳 明天 会 消失 的 可 信 的 后 验 概率 进行 积分 ， 这 会 得 到 太阳 
的 结论 。 然 而 ， 数 学 期 望 并 不 能 很 好 地 概括 纯粹 贝 叶 斯 主义 者 的 后 验 
粹 贝 叶 斯 主义 者 的 后 验 中 位 数 恰 好 与 平均 后 验 概率 期 望 值 处 于 同一 数 
如 果 我 们 假设 太阳 某 天 消失 的 概率 是 PP， 并 将 太阳 的 寿命 记 作 Vp) 





























的 话 ， 我 们 计算 的 就 是 








E[V(E[p|D])]]. EGER] UL nur EEE, p ELVD], if mdr 





位 数 是 使 得 P[Kp) < xID] < 1/2 B9 x 的 值 。 
© 实际 上 ， 拉 普 拉 斯 希望 计算 的 只 是 太阳 明天 没有 升 起 的 概率 ， 而 不 是 太阳 的 预期 寿命 。 
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那么 概率 计算 给 出 的 结果 就 是 ， 人 类 预期 寿命 的 平均 预测 结果 刚好 是 100 27" ! 

这 个 神秘 的 现象 被 作家 艾 伯 特 ' 戈 德 曼 称 为 林 迪 效应 ， 后 来 数学 家 伯 努 
瓦 ， 曼 德尔 布 罗 和 统计 学 家 纳 齐 姆 . 塔 利 布 也 沿用 了 这 一 名 称 ， 这 个 名 字源 自 一 
个 叫 作 林 迪 (Lindy's) 的 餐馆 ， 喜 剧 演 员 经 常 在 那里 讨论 怎样 才能 在 演艺 界 坚持 
更 长 的 时 间 。 戈 德 曼 注 意 到 ， 某 位 喜剧 演员 之 后 出 现在 餐馆 的 次 数 与 他 已 经 出 现 
过 的 次 数 成 正比 。 曼 德尔 布 罗 补充 道 :“ 无 论 某 人 已 产生 的 工作 量 有 多 少 ,日 后 其 
工作 会 增加 同样 的 工作 量 。” 然 后 塔 利 布 对 这 个 经 验 观察 结果 做 出 了 解释 ， 他 在 这 
里 用 的 是 所 谓 的 窘 律 ， 它 无 处 不 在 ， 比 如 令 人 惊异 的 齐 普 夫 定 律 ( Zipf's law) 就 
一例。 它 预 言 了 在 一 篇 文章 中 出 现 频 率 排 第 位 的 字母 ， 其 出 现 频 率 大 概 
就 是 出 现 频 率 最 高 的 字母 的 n 分 之 一 外。 

拉 普 拉 斯 的 接续 法 则 有 着 无 比 惊 人 的 大 量 的 实际 应 用 ， 其 中 之 一 就 是 让 人 们 
在 第 二 次 世界 大 战 中 根据 俘获 的 纳粹 坦克 的 序列 号 ， 推 断 出 坦克 的 总 数 2。 句 





















































是 其 





























贝 叶 斯 主义 的 寒冬 





不 地 的 是 ， 科 学 在 当年 还 没有 发 展 到 那 一 步 。19 世纪 的 智者 并 没有 看 到 贝 叶 
晰 推理 那 令 人 醉心 的 有 效 性 ， 而 是 几乎 一 致 否 定 了 拉 普 拉 斯 的 道 概率 。 数 学 家 乔 
itc 克 里 斯 特 尔 断 言 :“( 这 些 概率 ) 已 经 死 了 ， 我 们 应 该 将 它们 体面 地 埋葬 在 看 不 
到 的 地 方 ， 而 不 是 在 课本 和 试题 中 介绍 它们 …… 我 们 应 该 允许 自己 悄悄 忘却 伟人 
的 鲁莽 之 处 。 

对 于 拉 普 拉 斯 方法 和 理论 中 存在 主观 置信 和 度 这 一 点 ， 其 他 人 的 反应 更 刻 毒 。 
哲学 家 约翰 . 斯图尔特 ' 密 尔 对 拉 普 拉 斯 提出 了 批评 ， 将 他 的 哲学 形容 成 “心智 

常 





































































































除了 被 约瑟夫 贝 特 朗 在 战争 的 不 确定 性 中 用 于 决策 ， 以 及 被 享 利 * 庞 加 莱 
中 的确， 如 果 设 X=100， 而 令 x 为 随机 选取 的 菜 个 人 的 年 龄 ,那么 对 预期 寿命 的 预测 就 是 2+， 然 


in =x. 




















X 
后 对 所 有 x 的 值 进行 积分 就 能 得 到 预测 的 平均 值 。 我 们 会 得 到 下 [2x] f 2 

















Q 拉 普 拉 斯 接续 法 则 也 出 现在 了 所 谓 的 末日 论证 中 ，Monsieur Phi 和 我 在 相关 视频 中 对 此 进行 
了 讨论 ， 详 见 书后 注释 。 
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在 德 雷 福 斯 事件 ”中 用 于 排除 定罪 证 据 的 有 效 性 以 外 , 拉 普 拉 斯 的 置信 和 度 和 贝 叶 斯 
公式 似乎 在 科学 领域 中 销声匿迹 了 。 

20 世纪 初 的 情况 变 得 更 糟糕 ， 而 此 时 涌现 了 频率 学 派 的 统计 学 家 埃 贡 . 皮尔 
ib. HBH - 内 曼 和 罗 纳 德 . 费 希 尔 。 即 使 这 些 天 才 互 不 理解 ， 却 都 同意 应 该 终结 
贝 叶 斯 和 拉 普 拉 斯 理论 中 的 主观 性 。 费 希 尔 疯 狂 地 侮辱 了 这 些 理论 ， 用 上 了 “ 诬 
误 的 垃圾 ”这 种 字眼 ， 而 内 曼 在 他 自己 的 置信 区 间 理 论 中 完全 略 去 了 所 有 贝 叶 斯 
式 的 概念 ， 因 为 “如 果 理 论 的 建造 从 一 开始 就 不 涉及 贝 叶 斯 主义 和 先 验 概 率 的 话 ， 
任何 理论 都 会 更 漂亮 "。 自 此 之 后 ， 在 几乎 整个 20 世纪 中 ,“ 主 观 ”“ 先 验 ” 和 
“ 贝 叶 斯 ”这 些 术 语 被 驱逐 出 了 统计 学 系 。 

但 贝 叶 斯 主义 没有 死 。 有 几 个 坚定 不 届 的 人 ， 比 如 埃 米 尔 : 博 雷 尔 、 弗 兰 
DE + 拉 姆 齐 和 布鲁诺 德 ， 菲 内 莹 ， 他 们 认为 主观 概率 是 理解 赌博 必 不 可 少 的 数 
学 工具 。 然 而 ， 他 们 在 当时 是 相对 来 说 被 忽略 的 一 群 人 。 

费 希 尔 在 贝 叶 斯 主义 上 的 劲敌 是 地 理学 家 哈 罗 德 ， 杰 弗 里 斯 。 费 希 尔 将 他 的 
频率 主义 理论 出 色 地 应 用 在 遗传 学 的 实验 中 ,但 杰 弗 里 斯 从 中 看 到 ， 频 率 主义 如 
果 用 在 地 震 学 上 会 出 现 严 重 的 局 限 性 。 实 际 上 ， 为 了 研究 地 震波 的 传播 而 重 现 地 
震 ， 这 可 相当 困难 …… 对 地 震 的 测量 稀少 而 模糊 ， 但 在 得 到 贝 叶 斯 方法 这 一 武器 
后 ， 杰 弗 里 斯 就 知道 应 该 如 何 解 释 他 获得 的 数据 ， 并 由 此 确定 地 震中 心 ， 其 至 正 
确 猜 测 出 地 球 的 内 部 是 液态 的 。 然 而 ， 费 希 尔 否 认 贝 叶 斯 方法 科学 性 的 测 测 之 势 
济 没 了 杰 弗 里 斯 的 心平 气 和 。 




































































































































































































































































贝 叶 斯 主义 拯救 盟 军 
第 二 次 世界 大 战 打响 之 时 ， 学 术 界 的 统计 学 家 都 是 反 贝 叶 斯 主义 者 。 但 在 学 

















术 界 以 外 ,统计 学 的 地 位 也 不 怎么 样 。 英 国政 府 认识 到 破译 纳粹 密码 可 能 成 为 战 





(D 德 雷 福 斯 事件 是 法 国政 治 史上 的 重要 事件 。19 世纪 末 ， 法 国 犹大 疹 军 官 阿尔 弗 雷 德 . 德 雷 福 
斯 被 怀疑 向 德军 提供 军事 情报 ， 后 被 判 叛 国 ， 但 后 来 发 现 泄露 情报 者 另 有 其 人 ， 但 当时 法 国 
军 方 与 法 国政 府 无 视 证 据 的 有 效 性 ， 仍 然 坚持 判决 ， 在 社会 上 引起 强烈 争议 。 案 件 几经 波折 ， 
最 后 德 雷 福 斯 被 平反 ， 但 其 余波 大 大 影响 了 法 国 的 政治 与 社会 风气 。 一 一 译 者 注 
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争 的 关键 ， 他 们 为 此 优先 聘请 的 是 文字 工作 者 、 艺 术 家 和 历史 学 家 。 幸 运 的 是 ， 
英国 数学 家 也 加 入 进来 ， 他 们 自称 物理 学 家 来 博取 英国 政府 的 关注 。 相 反 ， 统 计 
学 家 却 被 忽略 了 。 这 可 能 是 件 好 事 ， 因 为 被 这 些 “ 真 正 ”的 统计 学 家 唾弃 的 贝 叶 
斯 公式 将 成 为 此 次 行动 的 关键 。 
第 二 次 世界 大 战 用 的 是 一 种 新 的 密码 术 ， 也 就 是 机 械 密码 。 纳 粹 军队 专用 的 
密码 机 叫 作 恩 尼 格 玛 密 码 机 ( Enigma )。 恩 尼 格 玛 密 码 机 与 打字 机 类 似 ， 其 特点 是 
将 输入 内 容 加 密 并 打印 出 来 。 更 妙 的 是 ， 要 解密 某 段 密码 ， 只 需要 将 它 输入 机 器 
即 可 Bl, 

好 吧 ， 并 不 完全 是 这 样 。 这 种 机 器 的 加 密 和 解密 方式 依赖 于 机 器 配置 。 纳 粹 
军队 每 天 都 会 使 用 不 同 的 机 器 配置 ， 然 而 ， 恩 尼 格 玛 密码 机 在 出 厂 时 就 包含 上 百 
万 个 配置 方式 。 更 大 的 问题 在 于 纳粹 军队 手中 的 机 器 还 有 和 额外 的 功能 ， 可 以 大 大 
扩充 恩 尼 格 玛 密码 机 的 可 能 配置 总 数 ， 差 不 多 有 数 万 兆 〈102 ) 种 。 要 测试 所 有 这 
些 配 置 简直 是 痴心 妄想 。 

在 温 斯 顿 . 丘吉尔 等 人 的 推动 下 ， 英 国政 府 逐 步 了 解 到 ， 数 学 将 是 破译 这 些 
政 方 密码 的 关键 。 在 布 莱 切 利 园 ， 一 文 梦 之 队 就 此 结 成 ， 其 中 包括 了 彼得 特 温 、 
RA- BETE, WE. 汤 特 、 比 尔 ' 塔 特 、 马 克 斯 * 纽曼 、 杰 克 … 古 德 ， 当 
然 最 重要 的 还 是 伟大 的 艾 伦 : 图 灵 。 

我 们 会 在 之 后 的 章节 中 谈 到 图 灵 在 1936 年 关于 可 计算 性 理论 的 大 量 发 现 。 但 
当时 ， 正 如 电影 《模仿 游戏 》( Imitation Game) 中 描述 的 那样 ， 图 灵 很 快 理解 了 
应 该 如 何 将 大 量 计算 步骤 自动 化 ， 从 而 破译 恩 尼 格 玛 密码 机 。 这 让 他 能 够 建造 名 
为 “炸弹 ”( Bombe ) 的 机 器 ， 这 种 机 器 每 天 都 能 破译 纳粹 陆军 和 空军 的 密码 。 然 
而 ， 纳 粹 海军 用 到 了 更 高 级 的 恩 尼 格 玛 密码 机 ， 而 要 破译 它 的 话 ,“ 炸 弹 ” 的 速度 
不 够 。 更 糟糕 的 是 ， 纳 粹 当局 用 的 密码 更 为 复杂 ， 其 原型 不 是 恩 尼 格 玛 密码 机 ， 
而 是 洛 仑 效 ( Lorenz) 密码 机 。 

图 灵 接 受 的 第 一 个 挑战 就 是 说 服 英国 当局 ， 无 论 是 纳粹 海军 的 恩 尼 格 玛 密码 
机 还 是 纳粹 当局 的 洛 仑 效 密 码 机 ， 都 是 可 以 破译 的 ， 而 且 ， 破 译 这 些 密码 的 投资 
并 不 会 毫 无 回报 。 英 国 当 局 在 很 长 一 段 时 间 内 并 不 信服 。 这 些 密码 似乎 过 于 复杂 ， 
而 要 破译 它们 ， 无论 是 在 时 间 、 人 力 还 是 硬件 上 都 要 付出 高 昂 的 代价 。 然 而 图 灵 
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的 结论 是 ， 这 些 都 是 值得 的 。 
sis 
H 


丘吉尔 最 后 被 说 服 了 。 他 后 来 承认 : "BAR pE— ESAR, 








就 是 ( 纳 


粹 海军 的 ) 潜水 艇 带 来 的 危险 。” 这 些 潜水 艇 已 经 击 沉 了 大 量 从 大 洋人 彼岸 驶 来 的 补 








给 船舶 。 杰 里 ， 罗 伯 蒋 上尉 补充 道 ， 如 果 这 种 情况 长 期 持续 下 去 的 话 





，“ 英 国 可 








能 ， 甚 至 非常 可 能 陷入 饥 范 并 输 掉 战 争 ”。 而 破译 洛 仑 兹 密码 机 则 可 以 让 英国 直接 


























知晓 阿道夫 和 希特勒 的 意图 与 策略 ， 特 别 是 有 助 于 知道 他 究竟 预计 英 妇 
加 羔 还 是 诺曼底 登陆 。 








FE 会 在 法 国 
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图 灵 的 研究 得 到 了 绿灯 放行 ， 接 下 来 就 要 找到 正确 的 想法 了 。 你 可 外 
案 就 是 贝 叶 斯 公式 。 图 灵 找 到 了 一 种 试探 性 的 方法 ， 能 以 定量 的 方式 应 用 贝 叶 
斯 公式 。 图 灵 用 的 单位 叫 班 伯 里 ( banburismus )， 简 称 班 (ban) 一 一 这 其 实 是 一 


E SIT, 





座 城市 的 名 字 ， 它 提供 了 用 于 尽 可 能 将 相关 计算 自动 化 的 物资 。 战 争 落下 帷幕 之 
后 ， 图 灵 于 战争 期 间 在 美国 遇见 过 的 一 位 数学 家 克 劳 德 . 香农 提出 了 班 们 里 的 一 
种 变 体 ， 赋 予 它 一 个 今天 人 们 耳熟能详 的 名 字 : 比特 ( bit )。 我 们 之 后 会 再 谈 到 这 














= 





方式 似乎 能 够 部 分 解码 某 条 信息 的 时 候 ， 这 个 配置 就 会 获得 班 伯 里 值 ， 














现在 ,我 们 先 回 到 图 灵 和 第 二 次 世界 大 战 。 每 当 某 个 恩 尼 格 玛 密码 机 的 配置 


或 者 说 是 


贝 叶 斯 置信 和 度 。 图 灵 将 不 同 配置 方式 的 班 伯 里 值 结合 起 来 考虑 ， 就 能 够 将 搜索 引 
导 到 优先 测试 更 有 希望 的 配置 上 。 我 在 这 里 大 大 简化 了 对 相关 过 程 的 叙述 ， 但 这 
个 过 程 的 确 能 让 解码 速度 大 大 提高 。 最 后 ， 图 灵 及 其 同事 与 他 们 的 机 器 逐渐 能 够 



































解读 纳粹 的 大 部 分 信息 。 
历史 学 家 了 哈里. 欣 斯 利 断 言 ， 英国 数学 家 的 工作 “将 战争 缩短 了 
甚至 四 年 "。 有 人 甚至 认为 ， 如 果 没 有 他 们 的 话 ， 战 争 的 结果 并 不 明朗 。 















































至 少 两 年 ， 
更 无 可 非 


议 的 是 ， 图 灵 和 同事 的 数学 工作 ， 以 及 对 贝 叶 斯 公式 的 适时 应 用 ， 托 救 了 数 千 万 








人 的 生命 。 











然而 ， 战 争 落下 帷幕 之 后 ， 这 一 切 都 被 保密 。 温 斯 顿 ' 丘吉尔 用 尽 一 切 办 法 
确保 这 种 保密 状态 。 他 下 令 销 毁 所 有 可 能 暗示 纳粹 密码 曾 被 破译 的 文件 ， 并 将 贝 








叶 斯 公式 〈 以 及 图 灵 的 那些 机 器 ) 深 深 地 埋藏 了 起 来 。 
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频率 主义 海洋 中 的 贝 叶 斯 孤岛 


成 争 之 后 ,“ 贝 叶 斯 ”这 个 术语 仍然 是 一 种 侮辱 。 在 20 世纪 50 年 代 ， 一 位 美 
国 统计 学 家 半 开 玩笑 地 说 某 位 同事 是 “反对 美国 的 ， 因 为 他 是 贝 叶 斯 主义 者 ， 而 
贝 叶 斯 主义 会 让 美国 政府 失去 威信 ”。 男 一 位 统计 学 家 补充 说 :“ 贝 叶 斯 主义 统计 学 
家 还 不 够 贝 叶 斯 。 如 果 他 们 妃 随 贝 叶 斯 的 脚步 ， 只 在 死 后 发 表 文 划 的话， 我 们 就 
能 避免 很 多 问题 了 。” 大 学 中 的 统计 学 系 对 贝 叶 斯 主义 的 反对 尤为 深切 。 在 战争 中 
与 图 灵 并 肩 使 用 贝 叶 斯 公式 的 杰克 ， 古 德 曾 经 尝试 弘扬 贝 叶 斯 方法 的 好 处 ,但 人 
们 一 次 又 一 次 对 他 的 话 充 耳 不 闻 。 

贝 叶 斯 的 火焰 却 在 远离 学 院 的 地 方 重新 燃 起 ， 这 要 归功 于 亚 瑟 ， 贝 利 这 位 富 
有 魅力 的 美国 精算 师 。 佑 算 人 的 一 生 中 的 随机 事件 对 于 决定 保险 价格 来 说 至 关 重 
要 。 某 项 风险 的 概率 越 大 ， 为 这 项 风险 提供 保障 的 代价 就 越 大 ， 所 以 保险 价格 也 
应 该 越 高 。 然 而 ， 这 些 概率 并 非 基 于 费 希 尔 的 p 值 ， 而 是 通过 某 些 难以 理解 的 公 
式 计算 而 来 的 。 知 道 这 些 公式 来 源 的 精算 师 十 分 稀少 ， 但 所 有 人 都 察觉 到 这 些 公 
式 都 会 给 出 一 致 的 结果 。 精 算 师 的 计算 很 有 效 ， 但 没有 人 知道 为 什么 ! 受 频率 主 
义学 派 训练 的 贝 利 对 此 相当 震惊 。 

然而 ， 贝 利 最 终 发 现 这 些 奇怪 的 精算 公式 ， 比 如 我 们 在 之 后 的 章节 中 会 看 到 
的 神奇 公式 ， 与 贝 叶 斯 公式 有 着 神秘 的 相似 之 处 。 在 经 过 一 年 的 怀疑 之 后 ， 贝 利 
最 终 拥 抱 了 作为 保险 定价 基础 的 这 些 类 贝 叶 斯 式 的 推断 方法 ， 甚 至 将 自己 接受 的 
频率 主义 教育 抛 诸 脑 后 ， 发 起 了 反对 费 硕 尔 方法 的 运动 。1950 年 ， 贝 利 发 表 了 一 
篇 论文 ， 将 作为 精算 基础 的 信和 度 理 论 与 拉 普 拉 斯 、 普 赖 斯 和 贝 叶 斯 的 工作 联系 在 
了 一 起 。 他 在 文章 中 高 度 赞赏 了 主观 概率 的 概念 ， 宣 布 频率 主义 的 “暴政 ”将 会 
终结 。 不 笠 的 是 ， 在 打出 反对 费 希 尔 的 旗帜 不 久之 后 ， 贝 利 就 因为 心血 管 疾病 去 
ET. 

还 有 两 个 半 学 者 有 着 贝 叶 斯 式 的 思考 方式 。 我 们 先 从 那 半 个 贝 叶 斯 主义 者 说 
起 。 在 第 二 次 世界 大 战 之 前 ， 安 德 烈 . 柯 尔 英 哥 洛 夫 在 1933 年 最 终 提出 了 一 套 公 
理 ， 可 以 作为 概率 论 的 基础 。 对 于 柯 尔 莫 哥 洛 夫 来 说 ， 最 重要 的 不 是 对 概率 意义 
的 诠释 ， 而 是 处 理 概率 的 规则 。 但 即使 柯 尔 莫 哥 洛 夫 自 称 倾向 于 频率 主义 ， 当 他 
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被 迫 将 其 概率 理论 应 用 到 军事 策略 中 时 ， 他 所 发 展 出 的 一 种 推理 方法 ， 与 一 个 世 
纪 以 前 贝 特 朗 的 方法 完全 一 致 。 

在 第 二 次 世界 大 战 之 后 ， 概 率 论 的 数学 形式 化 让 丹尼斯 . 林 德 利和 伦 纳 
德 . 萨 维 奇 开始 否定 费 希 尔 的 频率 主义 统计 学 。 与 之 相对 的 是 ， 贝 叶 斯 公式 是 柯 
尔 莫 哥 洛 夫 公 理 的 直接 推论 ， 因 此 它 在 数学 上 有 着 坚实 基础 。 此 外 在 1958 年 ， 林 
德 利 发 表 了 一 篇 论文 ， 证 明了 被 称 为 “信念 推断 ”的 一 种 费 希 尔 的 概率 推 肠 方法 
相 矛 盾 。 林 德 利 敢于 拒绝 向 费 希 尔 俯首 称臣 ， 他 是 正确 的 。 由 此 大 获 全 胜 后 ， 
林 德 利 成 了 倡导 贝 叶 斯 主义 的 活跃 分 子 ， 宣 称 所 有 统计 都 是 贝 叶 斯 公式 的 某 种 特 
殊 情 况 或 近似 ， 并 在 英国 建立 了 数 个 偏向 贝 叶 斯 主义 的 统计 学 系 。 

轮 到 萨 维 奇 了 ， 他 在 1954 年 出 版 了 《统计 学 基础 》( The Foundations of 
Statistics )， 在 书 中 他 对 概率 的 主观 诠释 进行 了 辩护 。 萨 维 奇 与 其 他 人 不 同 的 地 方 
在 于 ， 他 将 贝 叶 斯 公式 当 作 “救世 主 ”。 萨 维 奇 并 不 像 其 他 人 那样 认为 贝 叶 斯 公式 
不 过 是 众多 推理 工具 之 一 。 对 他 来 说 ， 贝 叶 斯 公式 就 是 唯一 的 推理 工具 。 正 确 的 
推理 就 是 根据 贝 叶 斯 公式 进行 的 计算 ， 而 所 有 受 协 都 是 非 理性 的 (但 有 可 能 在 实 
用 主义 上 是 合理 的 ) 萨 维 奇 对 贝 叶 斯 主义 有 着 宗教 般 的 信仰 。 

当 人 们 问 萨 维 奇 这 会 不 会 给 科学 的 客观 性 带 来 疑问 时 ， 他 的 回答 是 ， 客 观 性 
就 是 科学 共同 体 中 涌现 出 的 共识 ， 当 积累 的 数据 足够 多 时 ， 这 种 共识 就 会 出 现 。 
然而 ， 萨 维 奇 也 补充 道 ， 这 也 是 定义 客观 性 的 唯一 方式 。 对 于 萨 维 奇 来 说 ， 频 率 
主义 的 方法 并 不 客观 ， 因 为 这 些 方法 总 是 需要 对 统计 结果 进行 解释 ， 甚 至 对 频率 
主义 具体 方法 加 以 选择 。 此 外 ， 费 希 尔 对 统计 分 析 的 客观 化 尝试 ， 尤 其 是 他 的 信 
念 推 断 ， 最 终 还 是 “一 种 奖 固 的 尝试 ， 想 前 出 贝 叶 斯 的 毅 蛋 ， 又 不 想 打 破 贝 叶 斯 
的 鸡蛋 "。 可 叹 的 是 , 像 贝 利 一 样 ， 正 当 推 广 贝 叶 斯 主义 的 运动 如 火 如 茶 之 际 ， 萨 
维 奇 死 于 了 心血 管 疾病 。 
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被 实干 者 拯救 的 贝 叶 斯 主义 














贝 叶 斯 主义 统计 学 家 没有 感受 到 理论 家 的 那 种 不 安 ， 照 样 推动 了 众多 领域 的 
变革 ， 在 这 些 领域 中 ， 频 率 主义 的 方法 似乎 不 甫 应 用 。 特 别 是 罗伯特 ' HER 38 AI 
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霍华德 . 赖 法 以 冯 … 诺 伊 曼 和 英 根 施 特 恩 的 博弈 论 为 基础 ， 结 合 了 效用 理论 和 主 
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观 概率 ， 发 展 出 包含 不 确定 性 的 决策 理论 。 由 此 ， 施 莱 弗 和 赖 法 将 哈佛 商学 院 转 























变 成 贝 叶 

















叶 斯 统计 








尔 绍 尼 和 罗 杰 “' 近 尔 森 ， 我 们 会 在 之 后 的 章节 中 再 谈 到 。 








贝 叶 





























斯 主义 的 温床 。 在 他 们 的 专著 出 版 后 不 久 ,， 各 商学 院 就 以 学 习 和 教授 贝 
1 自豪 ， 详 贝尔 经 济 学 奖 也 多 次 颁发 给 贝 叶 斯 主义 研究 者 ， 如 约翰 - 


斯 统计 的 神奇 之 处 在 于 可 以 处 理 数据 稀少 的 情况 。1950 年 ， 某 位 经 济 学 


家 询问 统计 学 家 戴 维 ' 布莱克 韦 尔 应 该 如 何 推算 五 年 内 发 生 另 一 场 世界 大 战 的 概 
率 。 作 为 一 位 频率 主义 的 好 学 生 ， 布 莱克 韦 尔 这 样 回 答 :“ 啊 ， 这 个 问题 毫 无 意义 。 


概率 只 对 由 可 重复 























有 件 组 成 的 长 序列 有 效 。 但 这 显然 是 独一无二 的 情况 。 概 率 要 


LEO, 要 么 是 1， 但 五 年 之 内 我 们 不 会 知道 这 个 概率 。” 经 济 学 家 这 样 回 答 :“ 我 
就 怕 你 这 样 说 。 我 跟 男 外 儿 位 统计 学 家 谈 过 ， 他 们 都 这 样 说 。” 后 来 ， 在 理解 了 频 
率 主义 统计 在 预测 能 力 上 的 缺陷 之 后 ， 布 莱克 韦 尔 归顺 了 贝 叶 斯 主义 。 
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这 一 流行 病 





斯 统计 的 男 一 个 重要 应 用 ， 就 是 研究 烟草 在 导致 肺癌 方面 








[的 危害 。 开 

















自 反 贝 叶 
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学 研究 的 英雄 是 态 尔 姆 :科恩 菲尔德 。 科 有 乱 菲 尔 德 首 先 遇 到 的 就 是 来 
斯 主义 者 内 曼 和 费 硕 尔 的 猛烈 批评 。 特 别 是 费 希 尔 ， 他 指责 科恩 菲尔德 


的 研究 中 缺少 频率 主义 方法 要 求 的 对 照 组 和 重复 实验 。 众 所 周知 ， 费 硕 尔 接受 了 
烟草 行业 的 资助 ， 试 图 否定 烟草 的 危害 。 他 甚至 提出 了 这 样 的 假设 : 肺癌 会 使 人 
倾向 于 吸烟 ! 正如 林 德 利 那样 ， 随 着 时 间 流 逝 ， 科 恩 菲 尔 德 最 后 还 是 获胜 了 。 
学 共同 体 得 到 了 统一 的 结论 : 吸烟 是 导致 肺癌 的 重要 危险 因素 。 





约翰 









































- 图 基 则 将 贝 叶 斯 统计 应 用 到 总 统 选举 结果 的 预测 








与 肯尼迪 的 选举 得 票 不 相 上 下 ， 胜 负 难 分 ， 没 有 一 家 电视 台 敢 宣布 最 终 的 结 


在 次 晨 两 点 ， 图 基 最 终 给 美国 全 国 




















科 


。1960 4E, JE vL 


广播 公司 (NBC) 电视 台 开 了 绿灯 ， 让 他 们 宣 
布 肯尼迪 的 胜利 。 但 直到 早上 8 点 ， 电 视 台 才 鼓 起 勇气 正式 宣布 这 一 结果 。 图 


基 


利用 的 方法 长 期 以 来 都 是 秘密 ， 尤 其 是 作为 统计 学 教授 ， 他 不 肯 承认 方法 中 有 着 
贝 叶 斯 的 成 分 。 

















近 十 几 年 来 ， 贝 叶 




















斯 方法 可 谓 一 帆 风 顺 ， 特 别 是 在 2008 年 ， 内 特 ' 西 尔 弗 成 


为 历史 上 第 一 个 正确 预测 美国 50 个 州 的 选举 结果 的 人 。 西 尔 弗 在 2016 年 的 预测 
就 没有 那么 亮 眼 了 ， 我 们 之 后 会 再 谈 到 这 一 点 。 


同样 ， 很 多 人 在 遇 到 稀有 事件 这 种 不 确定 4 
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生 时 ， 为 了 寻找 问题 的 实用 解决 方 





























案 ， 都 不 可 避免 地 转向 了 贝 叶 斯 公式 。 诺 曼 ' 拉 斯 称 森 正 是 如 此 ， 他 以 贝 叶 斯 置 
信和 度 为 工具 ,估计 了 核电 站 发 生 重大 事故 的 概率 ; 而 美国 国家 航空 航天 局 则 聘用 







































































了 一 个 机 构 ， 该 机 构 利 用 贝 叶 斯 主义 的 工具 ， 预 测 火箭 发 射出 现 重大 事故 的 概率 























是 三 十 五 分 之 一 。 这 和 远 远 大 于 美国 国家 航空 航天 局 自己 预测 的 十 万 分 之 一 的 概率 ， 


也 更 贴近 现实 。 























然而 ， 直 到 20 世纪 90 年 代 ， 贝 叶 斯 主义 的 这 些 成 功 仍然 罕见 且 不 一 致 ， 但 


























这 是 有 理由 的 。 贝 叶 斯 式 的 计算 既 宛 长 又 困难 ， 很 快 就 超出 了 数学 公式 的 实用 范 
畴 ， 其 中 经 常 需要 计算 没有 闭 式 的 积分 。 贝 叶 斯 主义 似乎 前 途 大 好 ， 但 并 不 一 定 
实用 。 使 相关 计算 更 广泛 、 更 容易 应 用 的 理论 的 出 现 ， 很 快 就 改变 了 整体 情况 。 
最 终 还 是 贝 叶 斯 主义 胜利 了 1! 


























贝 叶 斯 主义 的 胜利 


20 世纪 60 年 代 ， 
起 来 ， 这 就 是 人 工 智 外 























雷 : 所 罗 门 庄 夫 将 图 灵 的 可 计算 性 理论 与 贝 叶 斯 公式 结合 
一 般 性 框架 的 前 里， 我 们 在 下 一 章 还 会 以 更 长 的 篇 幅 介绍 

















他 。 就 像 在 他 之 前 的 人 那样 ， 所 罗 门 诺 夫 对 频率 主义 和 频率 主义 大 师 怀 着 深 深 的 
敌意 :“ 科 学 中 的 主观 性 通常 被 认为 是 罪恶 …… 如 果 它 出 现 ， 那 么 结果 就 完全 不 是 





























“科学 '"。 这 就 是 统计 学 大 师 费 希 尔 的 意见 。 他 希望 让 统计 学 成 为 “一 门 真正 的 科 
学 "， 完 全 脱离 其 中 曾 存 在 过 的 主观 性 。 我 认为 费 希 尔 在 这 个 问题 上 犯 了 严重 的 错 





误 ， 他 在 这 个 领域 的 了 








[ 作 严 重 破 坏 了 科学 共同 体 对 统计 的 理解 一 一 从 这 种 破坏 中 








恢复 过 来 的 速度 太 慢 了 。” 不 幸 的 是 ,所罗门 诺 夫 的 想法 长 期 以 来 处 于 纯粹 理论 的 
状态 ， 因 为 他 没有 必要 的 机 器 对 这 些 想法 开展 实验 。 

然而 ， 计 算 机 甫 一 出 现 ， 贝 叶 斯 主义 就 终于 等 到 了 神圣 的 重生 。 弗 雷 德里 
克 ，' 莫 斯 特勤 正 是 最 初 利用 这 些 新 工具 来 解决 贝 叶 斯 难题 的 几 个 人 之 一 。 然 而 ， 
特别 是 从 20 世纪 80 年 代 开 始 ， 所 谓 的 蒙特 卡 罗 方 法 ( Monte Carlo) 的 出 现 ， 特 
别 是 马尔 可 夫 链 蒙特 卡 罗 方 法 ( Markov-Chain-Monte-Carlo， 以 下 简称 MCMC ), 


















































给 贝 叶 斯 公式 的 实际 应 用 带 来 了 革命 。 与 其 精确 计算 那些 无 法 用 数学 公式 表达 的 
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[ay 





积分 ， 蒙 特 卡 罗 方 法 能 够 利用 抽样 进行 积分 的 近似 计算 。 而 一 个 名 为 吉 布 斯 抽样 由 
叶 斯 推断 ( Bayesian inference Using Gibbs Sampling， 简 称 BUGS ) 的 程序 更 是 宣布 了 
贝 叶 斯 主义 的 最 终 胜 利 ， 而 近年 来 出 现 的 深度 学 习 以 及 其 他 机 器 学 习 方 法 也 从 贝 叶 














的 理解 带 来 了 变革 ， 
E e 欣 顿 和 迈克 尔 





新 的 先 验 概率 中 获 益 ， 这 些 方法 也 许 会 导 任 人 类 历史 上 翻天 覆 地 的 社会 变革 FL 

最 后 ， 在 近 几 十 年 中 ， 贝 叶 斯 公式 和 贝 叶 斯 主义 的 框架 似乎 给 我 们 对 智 角 
无 论 是 关于 人 工 智能 还 是 人 类 智能 。 犹 地 亚 ， 珀 尔 、 杰 弗 
C 乔丹 等 计算 机 科学 家 ， 还 有 乔 希 ， 特 南 鲍 姆 、 卡 尔 ， 弗 里 斯 








顿 和 斯 坦 尼 斯 拉 斯 ， 德 阿 纳 等 神经 科学 研究 者 ， 都 将 贝 叶 斯 主义 视 为 所 有 认 知 
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CC 
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式 无 法 回避 的 支柱 。 








贝 叶 斯 无 处 不 在 





我 们 之 后 会 再 讨论 这 一 点 。 





An 


学 、 天 体 物 理学 、 











9 结尾 正 适 合 回顾 一 下 历史 上 贝 叶 斯 统计 学 那 宽 广 得 让 人 难以 置信 的 应 
用 范围 。 我 们 可 以 写 出 这 样 的 名 单 ， 排 名 不 分 先后 : 医学 诊断 、 遗 传 学 、 流 行 病 











政治 、 战 争 、 密 码 学 、 地 理学 、 神 学 、 博 弈 、 保 险 、 


赌博 、 决 策 、 经 济 、 航 空 航天 工程 、 人 工 智 能 、 神 经 科学 ……: 
这 些 都 是 我 们 在 本 章 中 谈 到 过 的 领域 。 但 贝 叶 斯 公式 的 应 用 远 远 超出 了 这 张 
名 单 中 的 内 容 。 我 们 还 可 以 加 上 排名 仍然 不 分 先后 ， 而 且 并 不 全 面 : 运动 、 心 





HE, #1 





和 蛋白质 人 研究、 资源 分 配 、 通 信 、 图 像 分 析 、 广 告 、 金 融 、 规 划 、 物 流 以 及 许多 其 


nee. TENE. 





























教育 、 社 交 网 络 、 自 动 翻译 、 信 号 处 理 、 基 因 组 测序 、 














^I 
那些 波折 。 


可 以 让 我 们 了 解 得 更 多 。 但 我 强烈 向 你 推荐 本 章 开头 谈 到 过 的 那 本 水 伦 + 麦 格雷 





是 ， 

















这 一 章 实在 太 短 ， 我 们 无 法 真正 探索 贝 叶 斯 理论 的 动荡 历史 中 的 











日 竣 巧 的 是 ， 维 基 百 科 和 Less Wrong 中 这 类 网 站 上 有 着 丰富 的 资源 ， 



































恩 的 优秀 著作 。 这 本 书展 示 了 科学 的 进程 并 非 一 条 静 静 流 消 的 长 河 。 学 习 是 一 支 
舞蹈 ， 充 满 了 波折 回旋 。 但 这 支 舞 蹈 似乎 不 可 避免 会 走向 进步 ， 而 这 里 的 进步 似 

















乎 就 是 接受 贝 叶 斯 方法 。 














我 对 这 一 领域 早 有 兴趣 ， 这 来 自我 对 科学 和 
数学 的 迷恋 。 然 而 ， 在 学 习 几 何 学 时 ， 我 最 
感 兴趣 的 是 证 明 是 如 何 被 发 现 的 ， 而 不 是 定 
理 本 身 。 同 样 ， 在 科学 中 ， 我 出 于 兴趣 首先 
关注 的 是 各 种 事情 是 如 何 被 发 现 的 ， 而 不 是 
这 些 发 现 的 具体 内 容 。 金 蛋 不 如 会 下 金 蛋 的 
AB ARA AGES. 

FE - 所 罗 门 诺 夫 (1926 一 2009 ) 


非 人 类 ， 也 非 机 器 








我 有 幸 亲 自 对 纯粹 贝 叶 斯 主义 进行 了 思考 。 我 一 步 步 切实 感受 到 ， 
识 哲 学 应 该 是 贝 叶 斯 公式 与 理论 计算 机 科学 的 某 种 巧妙 


























第 / 章 
所 罗 门 诺 夫 妖 


唯一 的 知 


但 在 很 长 一 段 时 间 


里 ， 我 不 知道 如 何 将 这 两 块 “ 拼 图 ”组 合 起 来 。 尽 管 我 已 经 着 手写 这 本 书 ， 但 我 


对 此 仍然 毫 无 头绪 。 
W, REITE MATAR. 


这 是 我 人 生 中 最 重要 的 时 刻 之 一 。 我 完全 被 吸引 住 了 。 我 感觉 到 一 幅 宏 大 拼 


图 的 所 有 碎片 就 在 我 眼前 完美 地 拼合 在 了 一 起 ， 令 我 频 目 结 舌 ， 我 多 年 
知识 哲学 的 “圣杯 ”显露 出 了 身影 。 真 是 难以 置信 ! 为 了 得 到 入 
罗 门 诺 夫 的 贝 叶 斯 计算 一 一 而 其 他 途径 很 有 可 能 通 向 失败 。 

















义 者 每 天 进行 的 那 种 计算 。 























MR, 


这 就 是 





不 和 的 是 ， 所 罗 门 诺 夫 的 纯粹 贝 叶 斯 主义 要 求 的 计算 非常 复杂 。 











只 需 需 进 行 所 
纯粹 贝 叶 斯 主 


来 追寻 的 




















我 们 那 位 纯 
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粹 贝 叶 斯 主义 者 不 可 能 是 人 类 。 更 糟糕 的 是 ， 这 些 所 需 的 计算 甚至 超越 了 所 有 计 
算 机 的 能 力 ， 因 而 同样 不 能 由 机 需 来 完成 。 纯 粹 贝 叶 斯 主义 者 既 不 是 人 类 ， 也 不 
是 机 器 。 如 果 我 们 承认 丘 奇 - 岁 灵 论题 的 话 ， 那 么 纯粹 贝 叶 斯 主义 者 只 可 能 是 超 
































脱 物理 定律 的 妖精 。 

















鉴于 所 罗 门 诺 夫 在 20 世纪 60 年 代 才华 横 溢 的 工作 ， 在 本 章 中 ， 我 会 将 这 个 


实体 称 为 所 罗 门 诺 夫 妖 ”。 但 在 讨论 它 之 前 ， 我 们 必须 回溯 几 十 年 的 时 间 ， 
想 史上 最 令 人 赞叹 的 概念 之 一 。 





算法 基础 











引入 思 


在 20 世纪 初 ， 数 学 正 处 于 危机 之 中 。 伯 特 兰 ， 罗素 刚刚 发 表 了 以 他 名 字 命 名 
的 悖 论 。 这 个 具有 毁灭 性 的 悖 论 中 表明， 要 将 数学 建立 于 坚实 的 基础 之 上 实在 无 











比 困 难 。 在 缺少 这 种 坚实 基础 的 情况 下 ， 数 学 就 像 一 座 纸牌 屋 ， 稍 有 解 而 








EE 








然 倒塌 。 戴 维 ' 希 尔 伯 特 也 意识 到 了 这 一 点 。 加 固 这 座 纸牌 屋 必须 成 为 逻辑 学 家 
和 数学 家 的 最 优先 目标 。 弗 雷 格 、 康 托 尔 、 皮 亚 诺 、 罗 素 、 怀 特 海 、 勒 贝 格 、 策 





























梅 洛 、 弗 兰 克 和 塔 斯 基 ， 他 们 只 是 参与 这 项 艰巨 任务 的 伟大 智者 之 中 的 一 
数 十 
Fo 我们 必须 知道 ， 我 们 必 将 知道 "， 他 在 广播 中 发 出 了 这 一 宣言 。 


Er 






































部 分 人 。 


F 来 的 工作 累积 成 了 对 外 行 来 说 越 来 越 星 梁 难 懂 的 著作 。 但 希 尔 伯 特 仍 未 放 


但 在 1931 年 , 一 位 25 岁 的 年 轻 逻 辑 学 家 令 希 尔 伯 特 的 期 望 化 为 咏 有 。 他 通 
常 被 认为 是 历史 上 最 伟大 的 逻辑 学 家 ， 他 就 是 库 尔 特 . 哥 德 尔 。 哥 德尔 证 明了 他 
辑 学 家 的 一 切 努 力 都 是 徒劳 无 功 的 : 数学 的 任何 基础 都 必定 只 是 一 座 纸牌 屋 。 我 
们 永远 不 可 能 证 明 这 些 基 础 无 法 动 授 。 这 就 是 哥 德 尔 (第 二 ) 不 完备 性 定理 P, 

尽管 无 法 给 希 尔 伯 特 和 数学 界 带 来 安慰 ,但 哥 德 尔 的 工作 以 及 其 他 逻辑 学 家 
























































构筑 的 形式 逻辑 有 着 很 好 的 眼光 ， 涉 及 第 3 章 谈 到 的 那些 符号 推演 规则 的 




















重要 性 。 





从 非常 形式 化 的 角度 来 看 ， 数 学 可 以 由 此 归结 为 一 门 非常 精确 的 语言 ， 其 句法 和 














© 我 拿 不 准 这 个 妖 应 该 是 什么 类 型 ， 但 我 不 忘 翻阅 历史 ， 还 有 参考 笠 卡 儿 妖 、 拉 普 拉 斯 妖 和 麦 
克 斯 韦 妖 的 重要 性 。 毕 竞 所 有 这 些 妖 都 拥有 一 个 特点 ， 即 贴近 其 至 超越 了 整个 宇宙 中 的 算法 
的 限制 ! 最 后 我 决定 分 挫 选 择 术 语 的 重大 责任 ， 在 社交 网 站 上 提出 了 一 个 随机 孔 多 塞 投 票 。 
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语法 都 非常 严格 。 这 门 语言 (假设 它 没有 矛盾 ) 中 的 语句 可 以 就 此 分 为 4 个 类 别 : 
可 证 明 、 可 否 证 、 不 符合 句法 、 无 法 判定 。 男 外 ， 给 定 一 个 语句 ， 要 确定 它 属于 
哪个 类 别 ， 相 当 于 询问 是 否 存在 某 个 符号 推演 的 序列 可 以 从 所 谓 的 公理 ， 即 被 承 
认 正 确 的 由 符号 组 成 的 语句 出 发 ， 最 终 到 达 给 定 的 语句 〈 或 它 的 否定 )。 

也 许 正 是 形式 逻辑 这 种 对 符号 推 注 的 研究 ， 让 库 尔 特 . EE, BTE + 丘 
奇 和 艾 伦 ' 图 灵 各 自 独立 发 现 了 一 串 “ 在 物理 学 上 可 行 ”的 符号 推演 的 三 个 不 同 
定义 。 哥 德尔 定义 了 一 般 递 归 函 数 这 一 类 别 ， 丘 奇 引 入 了 入 演算 ， 而 图 灵 则 发 明 
了 今天 以 他 的 名 字 命 名 的 计算 机 器 。 令 人 震惊 的 是 ， 丘 奇 和 图 灵 发 现 ， 所 有 这 些 
定义 实际 上 都 是 等 价 的 口 ! 

这 项 发 现 如 此 深刻 ,使 得 丘 奇 和 图 灵 提 出 了 所 谓 的 “ 丘 奇 一 图 灵 论 题 "。 这 一 
论题 断言 ， 所 有 “物理 上 可 行 的 操作 序列 * “纯粹 机 械 化 的 符号 推 注 ”*"“ 机 器 实行 
的 计算 ”以 及 “算法 ”的 概念 ， 实 际 上 都 等 价 于 哥 德 尔 、 丘 奇 和 图 灵 的 定义 。 正 
如 斯 科 特 ， 阿 伦 森 说 的 那样 :“ 如 果 你 花 上 足够 长 的 时 间 来 思考 这 件 事 的 话 ， 最 终 
就 会 得 出 结论 : 所 有 计算 都 可 以 通过 图 灵机 完成 。 

艾 伦 :图 灵 的 基本 定理 是 理论 计算 机 科学 的 基础 ， 它 证 明了 所 谓 通 用 图 灵机 的 存 
在 性 。 这 种 通用 图 灵机 可 以 模拟 任意 图 灵机 ， 因 此 它 能 计算 哥 德 尔 的 一 般 递 归 函 
数 以 及 丘 奇 的 演算 可 以 计算 的 所 有 东西 。 换 句 话 说， 存在 这 样 一 台 机 器 ， 只 要 
证 它 执行 正确 的 代码 ， 它 就 能 够 完成 可 以 想象 的 任何 〈 符合 物理 的 ) 计算 。 

从 表面 上 看 ,我们 可 能 会 认为 ， 对 这 个 计算 的 概念 感 兴趣 的 人 只 有 那些 逻辑 
或 纯 理论 的 研究 者 ， 也 许 还 有 一 些 研 究 模 拟 的 科学 家 。 然 而 ,我 们 可 以 将 丘 奇 - 
图 灵 论 题 诠释 为 这 个 宇宙 的 一 条 物理 法 则 ， 因 为 它 提出 ， 在 宇宙 中 没有 任何 计算 
机 器 能 够 解决 图 灵机 不 能 解决 的 问题 。 这 个 假设 牵涉 整个 宇宙 ! 因此 ， 如 果 丘 奇 - 
图 灵 论 题 正确 ， 那 么 用 上 整个 宇宙 的 计算 能 力 都 不 能 完成 某 件 通用 图 灵机 无 法 计 
算 的 事情 。 换 名 话说 ， 这 个 宇宙 中 的 所 有 东西 都 可 以 用 通用 图 灵机 来 模拟 外。 特 
别 是 , 如 果 丘 奇 - 图 灵 论 题 被 证 实 的 话 ,那么 我 们 的 大 脑 就 不 外 乎 是 一 台 图 灵机 。 
















































































































































































中 ”就 连 量子 力学 都 可 以 用 图 灵机 来 模拟 ( 特别 是 ， 如 果 我 们 采用 多 世界 诠释 或 者 德 布 罗 意 - 玻 
姆 诠释 的 话 ) 然而 ， 利 用 经 典 的 机 器 进行 这 样 的 模拟 所 需 花 费 的 时 间 会 比 量 子 计算 机 所 需 的 
时 间 长 得 多 ， 差 中 呈 指 数 增长 。 
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丘 奇 -图 灵 论 题 对 新 技术 产业 有 着 次 远 的 影响 。 这 是 因为 ， 从 计算 的 意义 上 
来 说 ,既然 我 们 的 大 脑 不 可 能 超越 通用 图 灵机 ， 那 么 我 们 不 如 大 力 投资 通用 图 灵 
机 的 生产 。 这 些 名 称 各 异 的 通用 图 灵机 已 经 占据 了 我 们 的 日 常生 活 。 我 们 今天 把 
它们 叫 作 计算 机 、 平 板 电 脑 或 者 智能 手机 O”, 














“模式 ”是 什么 ? 











无 论 是 在 数学 、 物 理 还 是 技术 上 ， 图 灵机 都 有 着 众多 应 用 。 但 我 讨论 图 灵机 
不 是 出 于 这 些 原因 ， 而 是 出 于 哲学 上 的 原因 。 这 是 因为 在 认识 论 的 意义 上 ， 要 
格 定义 数学 家 经 常 粗 略 谈 到 的 “模式 ”或 “规则 性 ”的 概念 ， 图 灵机 似乎 是 最 完 
美的 工具 。 

考虑 以 下 数列 : 1, 2, 4, 8, 16。 你 知道 下 一 项 是 什么 吗 ? 你 很 可 能 会 猜 16 的 下 
一 项 是 32， 甚 至 对 这 项 猜测 特别 有 自信 。 但 为 什么 呢 ? 我 只 给 出 了 这 个 数列 的 一 
个 非常 有 局 限 性 的 抽样 一 一 只 有 5 个 数据 点 ， 为 什么 它 之 后 的 项 看 起 来 那么 容易 
预测 ?” 你 对 自己 猜测 的 高 置信 度 又 有 何 依据 ? 

你 脑海 中 的 论证 大 概 是 这 样 的 : 1 乘 以 2 就 能 得 到 2， 将 2 变 成 4 也 是 乘 以 2， 
从 4 到 8、 从 8 到 16 也 是 这 样 。 所 以 问题 中 的 数列 就 应 该 是 将 前 一 项 乘 以 2 得 到 
的 。 这 个 模式 这 么 规则 而 简单 ， 似 乎 必定 会 延伸 下 去 。 换 种 说 法 ， 存 在 一 个 非常 
简单 的 算法 ， 也 就 是 计算 的 规则 ， 可 以 产生 这 个 数列 中 的 每 一 项 。 根 据 奥 卡 姆 剃 
J) (我 们 之 后 会 再 谈 到 )， 算 法 如 此 简洁 似乎 就 是 一 种 几 近 决定 性 的 论据 。 

然而 ， 上 文中 的 数列 还 有 一 种 完全 不 同 的 解释 方法 。 我 们 先 画 一 个 圆 (图 
7.1 )， 然 后 在 圆 上 取 两 个 点 ， 画 出 一 条 通过 这 两 个 点 的 直线 。 这 样 圆 的 内 部 就 被 分 
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成 了 两 份 。 在 圆 上 再 取 第 三 个 点 ， 然 后 画 出 它 与 之 前 两 个 点 的 连 线 ， 我 们 实际 上 
就 画 了 一 个 圆 内 接 三 角形 ， 把 圆 分 成 了 三 角形 和 外 面 的 3 个 部 分 ， 也 就 是 一 共 4 






































个 部 分 。 如 果 再 加 上 第 四 个 点 ， 画 出 它 与 其 他 三 个 点 的 连 线 的 话 ， 圆 就 被 分 成 了 8 
个 部 分 。 加 上 第 五 个 点 的 话 ， 圆 就 会 被 分 成 16 份 ! 

















© 从 技术 上 来 说 它们 不 算 图 灵机 ， 因 为 其 储存 空间 有 限 。 
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Æ 7.1 


所 以 1, 2, 4, 8, 16 这 个 数列 就 对 应 着 每 次 在 圆 上 添加 一 个 点 ， 然 后 画 出 它 与 其 
圆 划分 成 的 份 数 。 于 是 ， 为 了 得 到 下 一 项 ， 我 们 可 以 计算 加 
上 第 六 个 点 之 后 圆 被 切 成 多 少 份 。 
这 就 是 补 全 该 数列 的 另 一 种 方法 81. 
门 必 须 重 新 考虑 一 开 
添加 31 还 是 32 ? 存在 唯一 的 正确 答案 吗 ? 我 们 对 于 不 同 的 答 


他 点 的 连 


32! 所 以 ， 
如 此 一 来 ,我 
度 了 。 应 该 给 数列 





车 线 之 后 ， 将 医 


步 添加 新 的 点 以 及 它 与 之 前 的 点 的 连 线 ， 圆 就 会 





结 





始 应 





被 依次 分 成 1、2、4、8、16、31 份 





H 





会 让 你 大 吃 一 


应 该 对 数 





惊 ， 这 个 数字 是 31， 而 不 是 


列 下 一 项 的 猜测 赋予 多 少 置 信 








案 又 应 该 赋予 多 少 置信 度 ? 数列 的 下 一 项 还 有 没有 第 三 种 可 能 性 ? 




















我 们 仍然 觉得 ， 即 使 数列 下 一 项 有 充分 的 理由 是 31， 而 且 该 项 也 许 还 有 别 的 
可 能 性 ,但 32 仍然 是 最 可 信 的 。 我 们 有 没有 办 法 将 这 种 想法 严谨 地 叙述 出 来 ? 


所 罗 门 诺 夫 复杂 度 


1963 年 ， 数 学 家 安 德 烈 ， 


丘 奇 和 图 





靠 哥 德 尔 、 





8, 16, 32 和 1, 2, 4, 8, 16, 31 这 种 数列 的 复杂 度 。 这 种 复杂 度 





灵 关于 计算 的 概念 ， 


柯 尔 莫 哥 洛 夫 做 出 
定义 了 一 种 方法 ， 


定 的 回答 。 柯 尔 莫 哥 洛 夫 依 
用 于 衡量 类 似 1, 2, 4, 











洛 夫 复杂 度 ， 它 已 成 为 可 计算 性 理论 中 的 基础 概念 


但 柯 尔 莫 哥 洛 夫 并 不 是 第 
道 得 更 早 ， 在 1960 年 就 发 表 了 相关 研究 的 初步 报告 。 








一 个 想到 这 


个 复杂 度 


今天 又 被 称 为 柯 尔 莫 哥 





概念 的 人 。 所 罗 门 诺 夫 对 此 知 


所 以 ， 把 这 个 概念 叫 作 所 罗 











门 诺 夫 复杂 度 才 更 准确 ! 然而 ， 大 概 是 因为 所 罗 门 诺 夫 不 巧 将 他 的 复杂 度 与 在 美 





国 被 认为 是 异端 的 贝 


的 研究 结果 被 广泛 阅 


洛 夫 奖 ， 获 奖 原因 正 是 人 
因此 ， 从 某 种 意义 上 来 说 ， 



































叶 斯 主义 联系 在 了 一 起 ， 所 以 最 终 还 是 俄国 的 柯 尔 莫 哥 洛 夫 
读 和 引用 。 讽 刺 的 是 ， 所 罗 门 诺 夫 在 2003 年 被 授予 柯 尔 莫 哥 
也 发 现 了 柯 尔 莫 哥 洛 夫 复杂 度 ! 








本 章 也 是 对 所 罗 门 诺 夫 的 致敬 ， 我 在 这 里 斗 胆 不 
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沿用 被 广泛 接受 的 术语 ， 将 相关 概念 称 为 所 罗 门 诺 夫 复杂 度 ， 而 不 是 柯 尔 莫 哥 洛 
夫 复 杂 度 。 

粗略 地 说 ， 所 罗 门 话 夫 复杂 度 就 是 运行 时 能 生成 给 定数 列 的 最 短 源 代码 的 长 
度 。 但 所 有 程序 员 都 知道 ， 这 有 段 最 短 源 代码 的 长 度 取决 于 采用 何 种 编程 语言 。 用 
Java 写 的 源 代 码 几 乎 总 会 比 用 Matlab 写 的 长 。 所 以 所 罗 门 诺 夫 复杂 度 并 没有 良好 
的 定义 ， 它 依赖 于 使 用 的 编程 语言 。 如 果 我 们 考虑 直接 用 机 器 语言 写成 的 源 代码 
的 话 ， 那 么 它 就 依赖 于 我 们 考虑 的 图 灵机 O. 

万 幸 的 是 ， 这 种 依赖 性 并 不 太 大 。 这 是 因为 ， 有 一 些 被 称 为 “编译 器 ”的 计 
算 机 程序 可 以 将 用 某 种 语言 写成 的 源 代码 翻译 成 机 器 语言 ， 或 者 用 另 一 种 编程 语 
言 写成 的 代码 。 写 成 一 个 编译 器 可 能 要 花 很 长 时 间 ， 但 它 的 代码 长 度 是 有 限 的 ， 
而 且 关键 在 于 ， 这 个 长 度 不 依赖 于 需要 翻译 的 源 代 码 。 

我 们 详细 探讨 一 下 。 考 虑 两 台 通 用 图 灵机 M 和 NN。 令 C 为 一 个 从 M 到 NN 的 
编译 器 ， 也 就 是 一 段 运 行 在 机 器 NN 上 的 代码 ， 它 可 以 将 机 器 M 上 的 源 代码 翻译 成 
可 以 在 机 器 N 上 执行 的 代码 。 这 个 编译 器 源 代 码 compiler(N, M) 的 长 度 也 就 独立 
于 需要 翻译 的 任何 代码 的 长 度 。 
现在 假设 我 们 有 一 段 在 机 器 M 上 运行 的 源 代码 3$， 它 会 生成 一 段 数 列 。 我 们 
可 以 通过 下 面 的 方法 获得 一 段 在 机 器 N 上 运行 后 生成 同样 数列 的 源 代码 。 我 们 首 
先 写 出 编译 器 C， 然 后 写 出 源 代码 S$， 接 下 来 我 们 让 图 灵机 N 执行 经 编译 器 C 翻 
译 的 源 代码 S$。 于 是 图 灵机 N 就 会 进行 源 代码 S 在 图 灵机 M 上 执行 的 那些 计算 。 
粗略 地 说 ， 我 们 可 以 将 这 个 过 程 写成 M(S)=N(C, 5S)。 也 就 是 说 ， 机 器 N 会 生成 正 
确 的 数列 四 。 
更 厉害 的 是 ， 这 样 得 到 的 在 图 灵机 N 上 运行 的 源 代码 并 不 比 图 灵机 M 上 的 源 
代码 长 多 少 ， 它 的 长 度 就 是 5 的 长 度 加 上 C 的 长 度 。 所 以 ,该 数列 在 N 上 的 所 罗 
门 诺 夫 复杂 度 至 多 是 它 在 M 上 的 所 罗 门 诺 夫 复杂 度 再 加 上 一 个 独立 于 数列 本 身 的 
常数 ， 如 果 将 数列 记 作 工 ， 写 成 公式 就 是 KWCD) € KL) compiler (N, M)。 将 同样 

































































































































































中 ”值得 注意 的 是 ， 用 Java 写成 的 最 短 代 码 大 概 一 点 也 不 像 用 Java 写成 的 “优秀 代码 ”。 这 种 最 
短 代码 一 般 包含 一 个 解压 缩 函 数 ， 而 大 部 分 代码 是 压缩 过 的 结果 。 这 样 的 源 代码 对 于 人 类 来 


1M 4 


说 肯定 很 难 读 懂 。 

















的 论证 用 在 从 N 到 M AIA 
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译 器 上 ， 就 能 得 到 不 等 式 K,(L) 三 KW(L)+compiler (M, N)。 





我 们 就 此 得 到 结论 ， 除 去 一 个 加 法 常数 以 外 ， 机 器 M 上 的 所 罗 门 诺 夫 复 杂 度 与 机 


qe N EREZIE. 


BARE IE ERIR EE 











， 但 我 们 只 要 记 住 这 一 点 : 一 个 数列 的 所 罗 门 诺 


夫 复杂 度 的 确 不 是 一 个 客观 的 量 ， 虽 不 中 ， 亦 不 远 吴 一 一 特别 是 当 我 们 考虑 那些 
“合理 ”的 通用 图 灵机 时 。 无 论 如 何 ， 计 算 机 科 








我 们 会 再 看 到 ， 这 种 所 罗 门 诺 夫 复 杂 度 的 主观 性 正 是 所 罗 门 诺 夫 妖 的 概率 主观 性 

















学 家 已 经 习惯 了 这 一 点 。 而 且 之 后 





的 来 源 。 就 像 计算 机 科学 家 那样 ， 贝 叶 斯 主义 者 也 已 经 习惯 了 这 一 点 。 

, 4, 8, 16。 要 搞 清 楚 这 个 数列 最 “显然 ”的 下 一 项 到 底 是 31 
还 是 32， 我 们 可 以 研究 数列 1, 2, 4, 8, 16, 31 和 1, 2, 4, 8, 16, 32 的 所 风门 诺 夫 复杂 
度 。 根 据 奥 卡 姆 潭 刀 ， 所 罗 门 诺 夫 复杂 度 最 小 的 数列 就 是 最 可 能 的 答案 。 当 然 ， 
因为 所 罗 门 诺 夫 复杂 度 有 主观 成 分 ， 所 以 这 个 


我 们 回 到 数列 1, 2 

















有 计算 机 科学 家 都 会 觉得 ， 


比 第 一 个 “代码 更 好 写 ”。 

实际 上 ， 我 们 的 例子 对 于 所 罗 门 诺 夫 复杂 度 的 直接 应 用 来 说 还 是 太 简单 了 。 
这 是 因为 ， 在 这 种 情况 下 ， 在 很 多 编程 语言 中 生成 这 个 数列 的 最 简洁 的 方式 就 是 
将 它 一 项 一 项 直接 写 出 来 。 在 考虑 长 得 多 的 数列 时 ， 所 罗 门 诺 夫 复杂 度 才 会 变 得 


























更 重要 。 





问题 的 答案 也 是 主观 的 。 然 而 ， 所 
在 所 有 “合理 ”” 的 编程 语言 里 ， 接 上 32 的 第 二 个 数列 












































一 般 来 说 ， 如 果 我 们 现在 考虑 的 是 2 的 前 100 个 次 方 而 不 是 前 5 个 次 方 的 话 ， 
这 时 写 出 整个 数列 的 每 一 项 就 变 成 了 繁重 的 任务 。 对 于 所 有 “合理 ”的 编程 语言 





来 说 ， 程 序 员 都 可 以 做 得 更 好 ， 写 出 一 个 小 程序 来 逐次 计算 这 些 2 的 次 方 。 在 这 
种 情况 下 ， 这 个 数列 的 所 罗 门 诺 夫 复杂 度 就 显然 比 数列 的 长 度 小 ， 无 论 用 什么 编 
程 语言 ， 只 要 这 个 编程 语言 是 “合理 ”的 即 可 。 所 以 ， 我 们 可 以 合理 地 说 这 个 数 
列 的 第 101 项 非常 可 能 是 2. 






































中 ”对 于 任何 数列 ， 我 们 都 可 以 构造 一 个 编程 语言 ， 其 中 只 需要 几 个 指令 就 能 生成 这 个 数列 。 然 





而 ， 如 果 数 列 很 复杂 ， 

















那么 能 够 简洁 地 描述 这 个 数 多 





的 编程 语言 似乎 就 既 不 太 “ 合 理 "， 也 不 


“自然 "， 它 更 像 是 一 个 专门 为 这 个 数列 而 优化 的 语言 。 
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算法 与 概率 的 联姻 











妙 的 概念 。 然 而 ,一 旦 我 们 转向 经 验 





如 果 数 列 对 应 的 是 物理 量 的 测量 或 者 社会 科学 














要 研究 由 精确 无 误 的 计算 规则 产生 的 数列 ， 所 罗 门 诺 夫 复杂 度 的 确 是 个 美 








科学 ， 模 糊 性 和 误差 的 入 侵 就 无 法 避免 。 














的 数据 ， 我 们 就 应 该 预料 到 


数列 的 这 些 项 不 会 与 2 的 次 方 精确 吻合 。 假 设 我 们 得 到 的 数列 实际 上 是 0.9, 2, 
4.1, 7.9, 15.8， 我 们 现在 希望 在 测量 误差 为 0.2 左右 的 情况 下 预测 出 一 个 接近 

















31 或 者 32 的 值 。 


这 时 就 必须 用 到 概率 的 语言 了 。 尤 其 是 在 预测 时 ， 与 其 进行 确定 怕 
比如 预测 数列 的 下 一 项 恰好 是 32， 我 们 更 希望 做 出 概率 怕 

















E 的 预测 ， 


E 的 预测 。 通 常 来 说 ,我 


们 认为 32 是 非常 可 能 的 ， 但 31.9 或 32.2 等 数字 也 很 有 可 能 。 因 此 ， 一 个 定义 良 
好 的 概率 性 预测 应 能 计算 数列 中 下 一 项 的 所 有 候选 数值 的 正确 的 出 现 概率 。 

















将 哥 德 尔 、 丘 奇 和 岁 灵 的 可 计算 怕 


理论 与 贝 叶 








斯 、 普 赖 斯 和 拉 普 拉 











斯 的 概率 








理论 结合 起 来 ,我 们 就 得 到 了 关于 “一 个 理论 是 什么 ”的 全 新 定义 。 这 个 定义 正 





是 所 罗 门 诺 夫 智慧 的 结晶 。 对 于 所 罗 门 诺 夫 来 说 ， 理 论 就 是 











码 ， 给 定 某 个 数列 ， 它 就 会 计算 这 个 数列 出 现 的 概率 。 


此 前 为 使 叙述 简单 易 懂 ， 我 只 谈 到 了 数列 。 然 而 ， 根 据 我 们 之 后 会 谈 到 的 香 


图 灵机 上 的 一 段 源 代 





农 的 研究 工作 ， 所 有 数据 序列 都 可 以 翻译 成 0 和 1 组 成 的 数列 。 这 些 数列 又 叫 作 


0-1 序列。 因此 ， 计 算 机 科学 家 认为 ， 


一 般 而 言 ， 





眼睛 看 到 的 图 像 、 耳 条 听 到 的 声音 、 田 子 闻 到 的 气味 ， 
都 可 以 用 一 个 (非常 长 的 ) 由 0 和 1 组 成 的 数列 了” 描 





感官 接收 的 所 有 数据 


一 个 理论 就 是 一 个 算法 ， 给 定 某 个 有 限 0-1 序列 ， 就 能 计算 出 它 的 概率 。 

这 种 关于 理论 的 定义 可 能 看 起 来 太 狭 队 。 许 多 
论 和 和 牛顿 运动 定律 ， 看 起 来 都 不 是 能 计算 0-1 序列 概率 的 算法 。 的 确 如 此 。 从 某 
种 意义 上 来 说 ， 我 们 可 以 认为 这 些 理论 按照 所 罗 门 诺 夫 的 标准 是 过 于 含混 、 模 糊 





或 者 不 完整 的 。 














， 无 论 是 


还 是 中 耳 测 定 的 平衡 感 ， 
述 中 。 对 于 所 罗 门 诺 夫 来 说 ， 


公认 的 科学 理论 ， 比 如 演化 理 


然而 ， 有 一 个 更 有 趣 的 观点 : 现在 真正 进行 概率 计算 的 ， 正 是 依据 这 些 理论 
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次 














官 接收 的 信息 量 估计 大 概 在 每 秒 10 和 10! 比特 之 间 ， 虽 然 这 些 信 息 很 快 就 被 大 大 压缩 了 。 
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思考 的 大 脑 。 我 们 可 以 对 这 些 大 脑 讲述 一 段 演化 的 历史 ， 然 后 它 就 会 回答 这 段 历 
史 可 信 度 的 估计 值 。 然 而 ， 如 果 我 们 相信 丘 奇 - 图 灵 论 题 的 话 ， 这 些 大 脑 进 行 的 
不 过 是 一 台 拥 有 适当 源 代码 的 图 灵机 也 可 以 做 到 的 计算 。 因 为 我 们 讲述 的 演化 史 
可 以 编码 为 一 串 0 和 1 的 数列 ， 所 以 ,一 般 来 说 科研 工 作者 ( 在 这 个 例子 
化 学 家 ) 说 到 底 离 所 罗 门 诺 夫 的 体系 也 没有 太 遥 远 。 

可 以 说 ， 滨 化 理论 和 牛顿 运动 定律 都 对 应 着 一 组 子 程序 ， 进 行 预测 的 算法 可 
以 调用 这 些 子 程序 。 实 际 上 ， 科 学 中 的 理论 常常 就 是 一 组 方程 ， 计 算 机 科学 家 能 
够 利用 算法 结构 为 它们 建 模 ， 然 后 将 这 些 结构 与 解 方程 的 算法 结合 起 来 ， 这 些 算 
法 我 们 在 学 校 里 都 学 过 。 这 样 一 来 ， 我 们 就 得 到 了 不 同 的 代码 库 ， 对 于 能 进行 可 
信 预 测 的 算法 来 说 当然 非常 有 用 。 

所 以 我 们 可 以 认为 ， 这 些 至 关 重 要 的 代码 库 对 应 着 某 种 基本 法 则 。 科 人 研 工作 
者 的 日 常用 语 经 常 将 不 随时 间 变 化 的 理论 与 用 于 预测 的 额外 数据 分 开 。 比 如 说 ， 
物理 学 家 会 区 分 物理 定律 和 宇宙 的 物理 状态 ， 计 算 机 科学 家 也 经 常 将 算法 的 指令 
与 运行 算法 时 所 用 的 数据 区 分 开 来 。 我 们 也 倾向 于 认为 物理 定律 拥有 一 种 独立 于 
任何 物理 状态 的 真理 性 (或 者 有 效 性 )。 

然而 ， 图 灵 证 明 的 正 是 定律 和 状态 在 本 质 上 没有 区 别 。 毕 况 所 有 指令 序列 
(或 物理 定律 ) 都 可 以 编码 成 用 于 通用 图 灵机 的 数据 。 跟 数据 一 样 ， 任 何 指令 序 
列 (或 物理 定律 ) 也 只 是 一 段 信 息 。 约 其， 冯 … 诺 伊 曼 赖 以 构建 现代 计算 机 体系 
结构 的 基本 原则 也 正 是 这 一 点 ， 它 保证 了 得 到 的 结果 是 如 假 包 换 的 通用 图 灵机 。 
在 这 一 体系 结构 中 ， 指 令 和 数据 都 是 计算 机 储存 中 的 信息 ， 而 它们 之 间 没 有 本 质 
上 的 区 别 91, 

至 此 ， 所 罗 门 诺 夫 认为 ， 唯 一 值得 关注 的 信息 就 是 拥有 预测 能 力 的 算法 的 描 
述 。 要 求 算法 具有 预测 能 力 ， 是 为 了 明确 指出 对 于 奥 卡 姆 剃刀 的 应 用 至 关 重 要 的 
“理论 的 复杂 度 ”概念 。 这 是 因为 ， 物 理 定律 本 身 可 能 看 起 来 很 简单 : F= maA 
公式 只 需要 寥寥 几 个 符号 ,“ 都 是 因为 外 星人 ”这 句 话 也 不 长 。 但 这 是 因为 这 些 法 
则 本 身 并 不 具有 预测 能 力 。 要 拥有 预测 能 力 ， 它 们 就 必须 与 详细 程度 不 等 的 宇宙 
物理 状态 描述 结合 起 来 。 

正 是 这 一 点 让 我 们 可 以 区 分 不 同 定 律 的 复杂 度 。 有 些 定律 需要 对 宇宙 状态 极 
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为 详细 的 描述 才能 输出 预测 ， 最 终 就 构成 了 所 罗 门 诺 夫 复 杂 度 极 高 的 复杂 结构 。 
用 算法 的 术语 来 说 ， 这 种 定律 与 对 物理 状态 的 描述 组 合成 一 段 极 长 的 源 代码 。 反 
之 ,那些 通过 对 宇宙 物理 状态 的 非常 简略 的 描述 就 可 以 做 出 预测 的 理论 远 远 简单 
得 多 ， 因 而 在 先 验 上 也 更 可 信 。 

总 而 言 之 ， 所 罗 门 诺 夫 认为 ， 值 得 考虑 的 理论 应 该 包含 对 宇宙 物理 状态 的 
(部 分 ) 描述 ， 因 为 它 首先 必须 具有 预测 能 力 。 在 理想 情况 下 ， 这 种 理论 也 应 该 考 
虑 到 给 定 宇 宙 物 理 状态 的 不 确定 性 ， 但 最 重要 的 是 ， 最 终 它 必须 做 出 〈 概率 性 的 ) 
预测 。 毕 竟 一 个 理论 应 该 具有 给 出 可 计算 的 预测 才 值得 考虑 。 这 是 因为 ， 如 果 我 
们 相信 丘 奇 - 图 灵 论 题 的 话 ， 只 有 这 样 的 预测 才能 在 这 个 宇宙 之 中 实现 。 

我 们 如 果 跟 随 所 罗 门 诺 夫 的 脚步 ， 那 就 也 要 相信 所 有 值得 考虑 的 理论 组 成 的 
集合 恰好 是 所 有 计算 0- 1 序列 概率 的 算法 组 成 的 集合 。 正 如 阿 伦 森 认为 “你 如 果 
花 足 够 长 的 时 间 来 思考 ， 最 终 就 会 得 出 结论 : 所 有 计算 都 可 以 通过 图 灵机 完成 ”。 
我 现在 也 这 样 说 ， 你 如 果 花 足够 长 的 时 间 来 思考 ， 最 终 就 会 得 出 结论 : 任何 具有 
预测 能 力 的 理论 都 是 所 罗 门 诺 夫 意 义 上 的 理论 。 







































































所 罗 门 诺 夫 的 偏见 * 














作为 合格 的 贝 叶 斯 主义 者 ， 所 罗 门 诺 夫 接 下 来 提出 了 要 将 不 同 的 预测 性 理论 
进行 比较 ， 判 断 这 些 理论 各 自 的 置信 和 度 。 当 然 ， 为 了 做 到 这 一 点 ， 首 先 要 在 所 有 
对 0-=-1 序列 进行 概率 计算 的 算法 组 成 的 集合 上 取 一 个 先 验 概率 。 为 了 让 所 罗 门 诺 
夫 的 这 一 偏见 与 贝 叶 斯 主义 相 容 ， 其 中 一 个 条 件 就 是 不 同 的 预测 性 理论 的 先 验 置 
信和 度 之 和 必须 等 于 1。 

当然 ,许多 方法 可 以 做 到 这 一 点 。 但 是 ， 因 为 拥有 个 字符 的 源 代码 的 数目 
ZMA n 呈 指 数 增长 ， 所 以 从 直觉 上 来 说 ， 与 较 短 的 源 代码 相 比 ， 较 长 的 源 代码 
的 置信 度 呈 指数 减少 。 这 实际 上 就 必然 相当 于 使 用 某 种 非常 强大 的 奥 卡 姆 剃刀 ， 
我 们 之 后 会 再 谈 到 。 

更 加 实际 的 情况 是 ， 给 定 某 个 编程 语言 或 图 灵机 ， 要 给 可 计算 的 预测 性 理 
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组 成 的 集合 选 定 先 验 概率 分 布 ， 有 下 面 这 种 非常 典型 的 方法 "。 令 e, 20 为 对 应 着 
预测 性 理论 的 长 度 为 n 的 源 代码 数目 。 我 们 可 以 认为 所 有 这 样 的 源 代码 的 先 验 概 
率 都 等 于 1/(c, 2”)”。 换 句 话说 , 某 个 理论 了 的 先 验 概率 取决 于 选 定 的 语言 中 对 这 一 
理论 的 描述 长 度 KCD)， 具 体 的 等 式 ” 就 是 P[T] 71 cy 2*0), 

特别 要 提 到 的 是 ， 这 个 先 验 概率 与 所 罗 门 诺 夫 复杂 度 密 切 相 关 ， 因 为 先 验 概 
率 依赖 于 预测 性 理论 的 描述 长 度 。 然 而 这 些 描述 的 长 度 与 选用 的 编程 语言 有 关 ， 
所 以 它们 是 主观 的 。 也 就 是 说 ， 我 们 刚才 将 贝 叶 斯 先 验 概率 的 主观 性 与 所 罗 门 诺 
夫 复 杂 度 的 主观 性 联系 在 了 一 起 。 根 据 图 灵机 的 通用 性 与 编译 带 的 存在 性 ， 我 们 
得 出 结论 ， 这 些 主 观 性 都 是 随意 的 …… 但 其 实 也 没 那么 随意 ! 

所 罗 门 诺 夫 曾 如 此 雄辩 地 解释 道 : “长 期 以 来 ,我 感觉 我 的 算法 概率 理论 依赖 
于 一 台 参 考 机 器 的 事实 是 这 些 概 念 中 的 一 个 严重 缺陷 ， 我 曾 尝试 寻找 一 台 “ 客 观 ” 
的 通用 机 器 。 当 我 最 终 找 到 了 这 样 一 台 机 器 时 ， 我 发 现 自己 并 不 需要 它 一 一 它 对 
我 没什么 用 处 ! (……… ) 没有 数据 也 能 预测 ， 但 没有 先 验 概率 就 不 可 能 预测 。” 

























































































贝 叶 斯 主义 造就 所 罗 门 诺 夫 妖 * 











现在 我 们 构造 了 所 罗 门 诺 夫 的 偏见 ， 剩 下 的 就 是 应 用 贝 叶 斯 公式 来 决定 那些 
所 罗 门 诺 夫 定义 下 最 可 信 的 理论 了 ! 假设 我 们 目前 为 止 观察 到 了 一 个 0-1 序列 ” 
aa, do 某 个 预测 性 理论 了 的 贝 叶 斯 置信 和 度 可 以 通过 下 面 的 贝 叶 斯 公式 得 到 : 















































Pla 





PIT |a, =, a] = o 7 a, |T ]PIT] 
D?" Pla, =, a, |T]PIT] +2 Pla, …, a, |A |P] 








CD 这 当然 不 是 唯一 可 以 想象 的 概率 分 布 。 但 重点 在 于 ， 因 为 长 度 为 n 的 理论 数目 c, ZMA n E 
指数 增长 ， 所 以 在 任何 “合理 的 ”偏见 中 ， 某 个 理论 的 先 验 置信 和 度 都 随 着 其 描述 的 长 度 增加 

而 旺 指数 下 降 。 

D ”从 技术 细节 上 来 说 ,我 们 需要 对 c, =0 的 情况 进行 特殊 处 理 。 

© 我 隐藏 了 许多 技术 上 的 难点 ， 它 们 来 自 图 灵机 在 可 计算 性 上 的 限制 …… 我 们 之 后 会 谈 到 其 中 
一 些 限制 。 

© 注意 ,与 频率 主义 统计 相反 的 是 ， 我 们 并 没有 做 出 任何 独立 同 分 布 的 假设 ,也 就 是 说 ,我 们 
从 来 不 会 假设 这 些 随 机 变量 是 独立 的 ， 更 不 会 假设 它们 的 分 布 相同 。 
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这 里 的 预测 性 理论 4 是 7 的 所 有 替代 理论 。 

然而 ， 这 并 不 是 所 罗 门 诺 夫 妖 的 目的 。 它 的 目的 是 进行 预测 ， 而 不 是 计算 置 
信 度 ， 即 使 这 些 置信 度 很 有 用 。 要 达到 其 目的 ， 我 们 可 以 利用 条 件 概率 来 计算 给 定 
的 理论 了 的 预测 。 根 据 预测 性 理论 7， 数列 a.a, +, a, 接 下 来 的 一 项 是 1 的 概率 是 














Pla, ts Am 1 IT] 


P[g,,—1 lai tt, Am T] = Pla n Ir] 
ID ia n 





将 这 两 个 等 式 结合 起 来 ， 我 们 就 最 终 得 到 了 所 罗 门 诺 夫 妖 的 预测 结果 ， 正 如 
我 们 在 第 3 章 中 看 到 的 那样 ， 它 是 通过 对 不 同 理论 的 预测 取 加 权 平 均 得 到 的 ， 其 
中 的 权重 就 是 每 个 理论 的 贝 叶 斯 置信 度 。 我 这 里 省 去 了 一 些 计算 细节 ,但 我 希望 
你 也 能 自己 做 一 遍 ， 最 后 得 到 的 预测 就 是 : 



































ZPla, +, Am 1[T]P[T] 


P Oy. =] ai, 04] 一 
| | | | > Pla, tts a,|T JP[T] 
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这 个 神奇 的 公式 又 叫 所 罗 门 诺 夫 归纳 法 ， 所 罗 门 诺 夫 妖 为 了 进行 预测 而 整 天 计算 
的 正 是 这 个 公式 ! 真是 难以 置信 ! 这 个 奇妙 的 公式 就 是 贝 叶 斯 公式 最 纯粹 、 最 完 
美的 形式 。 也 就 是 说 ， 纯 粹 的 贝 叶 斯 主义 就 相当 于 进行 上 面 的 计算 ， 不 多 也 不 


少 ! 



































村 别 是 ， 一 旦 选 定 了 图 灵机 或 者 编程 语言 ， 所 有 模糊 之 处 就 不 复 存 在 。 理 性 、 
思考 和 预测 并 不 相当 于 遵循 数 个 模糊 、 任 意 且 有 时 互 不 相 容 的 规则 组 合 ， 这 种 事 
情 只 有 人 们 难以 理解 的 智者 才能 做 到 。 智 慧 可 以 归结 为 单纯 的 计算 ， 而 这 就 是 所 
罗 门 诺 夫 妖 进 行 的 计算 。 














所 罗 门 诺 夫 完 备 性 





所 罗 门 诺 夫 归 纳 法 的 基本 定理 ,就 是 所 罗 门 诺 夫 所 说 的 其 公式 的 完备 性 。 粗 
略 地 说 ， 所 罗 门 诺 夫 归纳 法 的 完备 性 表明 ， 如 果 数 据 中 存在 某 种 可 计算 的 模式 ， 
那么 所 罗 门 诺 夫 妖 最 终 会 发 现 这 一 模式 ， 所 需 时 间 与 模式 的 所 罗 门 诺 夫 复杂 度 成 
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IEE Y, 

更 准确 地 说 ， 数 据 越 复 杂 ， 所 罗 门 诺 夫 妖 为 得 知 其 中 隐藏 的 结构 所 需 的 信息 
量 就 越 大 。 但 所 罗 门 诺 夫 完备 性 证 明了 必需 的 信息 量 绝 不 会 超过 数据 的 精致 度 
(sophistication ) > ， 即 使 隐藏 其 中 的 结构 带 有 随机 涨 落 的 “噪声 ”! 

对 我 来 说 ， 有 了 这 个 基本 定理 ， 再 加 上 任何 其 他 方法 似乎 都 不 可 能 比 这 做 得 
更 好 或 者 至 少 持平 的 事实 ， 就 基本 上 是 支持 贝 叶 斯 主义 的 最 终 论据 了 一 一 即使 我 
们 必须 首先 相信 所 有 预测 性 理论 都 是 所 罗 门 诺 夫 式 的 理论 ， 而 且 最 完美 的 论证 应 
该 是 证 明 任 何 拥有 这 一 性 质 的 方法 ， 必 然 是 某 种 形式 的 所 风门 诺 夫 归纳 法 。 






















































































所 罗 门 诺 夫 归纳 法 的 不 可 计算 性 


因此 ， 在 这 种 狂热 面前 ， 你 可 能 会 提出 一 个 疑问 : 那 所 罗 门 诺 夫 归纳 法 岂 不 终 
结 了 对 知识 哲学 的 探求 ? 在 我 看 来 ， 大体 来 说 的 确 如 此 。 但 所 罗 门 诺 夫 归纳 法 有 
一 个 巨大 的 缺陷 ， 促 使 我 不 得 不 写 出 本 书 剩余 的 内 容 。 实 际 上 ， 所 罗 门 诺 夫 归纳 
法 太 复 杂 ， 难 以 实际 应 用 。 这 不 仅 是 我 们 自身 或 者 我 们 认 知 能 力 有 限 的 问题 一 一 
你 可 能 还 记得 ， 即 使 是 埃 尔 德 什 ， 他 也 奋斗 了 一 番 才 理解 了 贝 叶 斯 公式 的 一 个 简 
单 情 况 一 一 对 于 计算 机 也 是 如 此 。 

所 罗 门 诺 夫 归 纳 法 是 不 可 计算 的 。 这 是 什么 意思 ? 这 就 是 说 ,不 存在 任何 
灵机 可 以 严格 地 执行 这 种 计算 。 这 个 事实 有 个 非常 简单 的 原因 ， 但 那 无 关 紧要 ， 
而 男 一 个 原因 却 更 微妙 、 更 无 可 挽 
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O 更 准确 地 说 ， 所 罗 门 诺 夫 完备 性 定理 断定 ， 如 果 存 在 某 个 有 待 发 现 的 相关 理论 7， 那么 7 的 
所 罗 门 诺 夫 复杂 度 就 可 以 作为 所 罗 门 诺 夫 妖 的 所 有 预测 错误 的 累计 总 和 的 一 个 上 界 。 如 果 用 
第 15 章 会 谈论 的 KL 散 度 来 衡量 这 些 错 误 的 话 ， 对 于 只 用 到 两 个 字符 的 编程 语言 ， 我 们 就 会 



































得 到 Ea| S. Dis, (Pleins T*] ll PLIaza]) | T* | 2K(7")。 此 外 ， 我 们 也 能 解释 休 次 的 一 致 性 原 
n=0 








则 ， 它 其 实 相当 于 假设 基础 理论 7 的 存在 ， 但 丘 奇 - 图 灵 论 题 正 好 保证 了 这 一 点 。 而 在 
网 络 广播 Axiome 的 第 七 集 开 头 ， 我 也 指出 了 所 罗 门 诺 夫 完备 性 能 解决 所 谓 “grue” 的 逻辑 
TEE. 


© “精致 度 ” 一 词 在 这 里 有 着 非常 精确 的 定义 ， 我 们 会 在 第 18 章 中 介绍 。 
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简单 的 原因 是 ， 要 严格 执行 所 罗 门 诺 夫 的 计算 ， 就 必须 同时 考虑 无 限 个 预测 
性 理论 ， 这 是 出 于 算法 有 无 穷 个 这 一 单纯 的 原因 。 然 而 ， 没 有 任何 计算 机 或 者 计 
算 机 网 络 能 进行 这 种 无 限 长 的 计算 。 

话 昌 如 此 ， 我 们 可 以 这 样 回应 : 根据 先 验 概率 的 构造 ， 过 于 复杂 的 理论 对 应 
的 概率 无 论 如 何 都 会 呈 指 数 递减 ， 因 此 可 以 被 忽略 。 如 果 我 们 忽略 这 些 理论 的 话 ， 
因为 我 们 知道 它们 对 所 罗 门 诺 夫 归纳 法 的 预测 结果 影响 有 限 ， 那 么 不 就 可 以 做 出 
所 罗 门 诺 夫 归 纳 法 的 一 个 非常 好 的 近似 了 吗 ? 不 地 的 是 ， 这 也 不 行 。 

所 罗 门 诺 夫 归 纳 法 真正 的 难点 并 不 是 需要 考虑 的 理论 的 数目 ， 而 是 这 些 理 论 
所 需 的 计算 。 今 天， 在 计算 机 上 运行 的 算法 一 般 很 快 、 很 流畅 ， 这 是 因为 软件 工 
程 师 在 算法 上 面 花 了 心思 ! 但 一 般 来 说 ,我 们 其 实 很 难得 知 某 个 算法 会 不 会 很 快 结 
束 ， 而 想 要 知道 它 的 计算 会 终止 ， 还 是 会 越 来 越 复杂 ， 永 不 休止 ， 这 也 同样 困难 。 

这 种 算法 最 惊人 的 例子 之 一 就 是 锡 拉 丘 兹 猜想 ， 它 也 叫 作 科 拉 次 猜想 、 乌 拉 
姆 猜想 、 捷 元 猜想 或 3x+1 猜想 。 我 们 向 这 个 算法 输入 一 个 正 整 数 。 如 果 这 个 整 
数 是 1， 那么 算法 就 停止 ; 如 果 它 是 偶数 ， 那 么 算法 就 将 它 除 以 2; 如 果 它 是 奇数 ， 
那么 算法 就 将 它 乘 以 3 再 加 1。 然 后 ， 算 法 会 在 得 到 的 结果 上 重复 同一 套 运 算 。 锡 
拉 丘 兹 猜想 的 问题 是 : 无 论 输 入 什么 正 整 数 ， 这 个 算法 是 否 最 终 都 会 停止 1? 

看 起 来 无 比 奇怪 的 是 ， 我 们 还 不 知道 这 个 叙述 非常 简单 的 问题 的 答案 ， 连 怎 
么 尝试 解决 这 个 问题 ， 甚 至 连 解法 是 否 存在 都 不 知道 。 大 数学 家 埃 尔 德 什 : AK 
这 样 说 :“ 数 学 还 没有 准备 好 回答 这 样 的 问题 。 

这 可 能 就 是 图 灵 发 现 的 不 可 计算 性 的 一 个 例子 。 在 利用 图 灵机 定义 计算 的 概 
念 之 后 ， 图 灵 立 即 提出 了 这 样 的 问题 我们 能 不 能 在 运行 某 项 计算 之 前 就 预计 到 
它 是 否 会 停止 ” 换 句 话说 ,我 们 能 不 能 构造 一 人 台 图 灵机 ， 它 能 够 在 有 限 的 时 间 内 
预测 出 其 他 图 灵机 是 否 会 在 有 限 的 时 间 内 停止 ? 

你 可 能 觉得 图 灵 的 这 个 问题 有 点 像 咬 着 自己 尾巴 的 蛇 ， 这 并 不 是 偶然 。 在 康 
托 尔 的 对 角 线 法 、 罗 素 悖 论 以 及 哥 德 尔 不 完备 性 定理 的 启发 下 ， 图 灵通 过 自 指 论 
证 证 明了 这 些 问题 的 答案 都 是 否定 的 。 我 们 无 法 在 所 有 情况 下 预计 计算 是 否 会 停 
止 ， 因 此 我 们 说 停机 问题 是 不 可 计算 (或 者 不 可 判定 ) 的 Un, 

而 这 对 于 所 罗 门 诺 夫 归纳 法 来 说 是 个 大 问题 。 这 是 因为 ， 要 进行 所 罗 门 诺 夫 
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归纳 法 ， 就 必须 计算 不 同 理论 了 的 预测 结果 Pla, …, a TI, EHRE, R 
应 该 考虑 所 有 对 应 的 计算 会 终止 的 结果 。 然 而 ， 如 果 我 们 相信 丘 奇 - 图 灵 论 题 的 
话 ， 我 们 就 不 可 能 在 物理 上 断定 这 些 计 算是 否 会 终止 。 所 以 ， 这 个 论证 的 一 个 惊 
人 结论 就 是 ， 经 过 有 限 的 计算 时 间 之 后 ， 不 可 能 排除 某 些 预测 性 理论 的 计算 仍 未 
终止 但 终 将 停止 的 可 能 性 。 

更 糟糕 的 是 ， 我 们 同样 不 可 能 预计 这 些 理论 之 后 可 能 得 出 的 预测 是 否 会 大 大 
改变 此 前 的 结果 ， 所 以 ， 一般 来 说 我 们 在 有 限 的 计算 时 间 内 无 法 衡量 当前 结果 的 
有 效 性 。 所 罗 门 诺 夫 归纳 法 不 仅 不 可 计算 ， 而 且 它 的 所 有 近似 都 不 可 计算 ! 
























































所 罗 门 诺 夫 不 完备 性 











这 个 令 人 征途 的 结论 给 了 人 们 拒绝 贝 叶 斯 主义 的 动机 。 超 脱 物理 定律 与 丘 奇 - 
图 灵 论 题 的 所 罗 门 诺 夫 妖 当然 可 以 在 一 组 数据 中 检测 出 所 有 规律 ， 但 它 在 物质 世 
界 没 有 等 价 物 。 我 们 ， 以 及 我 们 的 计算 机 ， 似 乎 都 很 可 能 受 丘 奇 - 图 灵 论 题 的 制 
约 ， 所 以 我 们 也 似乎 不 可 能 进行 所 罗 门 诺 夫 归纳 法 的 近似 计算 。 一 般 而 言 ， 我 们 
在 物理 上 永远 不 可 能 得 出 对 贝 叶 斯 公式 的 近似 计算 的 一 个 合适 的 置信 和 度 。 这 个 智 
正方 程 双 有 何 用 ? 
所 罗 门 诺 夫 的 回答 就 是 他 的 另 一 个 定理 。 这 个 定理 断言 ， 所 有 这 样 的 算法 都 
必然 是 不 完备 的 。 更 准确 地 说 ， 所 有 可 计算 的 知识 哲学 都 不 可 能 检测 出 数据 中 的 
所 有 规律 。 这 就 是 惊人 的 所 罗 门 诺 夫 不 完备 性 定理 ， 它 比 哥 德尔 的 不 完备 性 定理 
还 要 让 我 感到 惊艳 ! 

换个 说 法 ， 无 论 你 的 知识 哲学 是 什么 ， 只 要 它 是 可 计算 的 ， 那 就 存在 某 些 可 
能 存在 的 世界 会 让 你 上 当 受 骗 ， 你 会 在 其 中 一 直 做 出 非常 错误 的 预测 ! 可 计算 性 
和 完备 性 是 两 种 不 兼容 的 性 质 Po 

这 样 的 话 ， 所 罗 门 诺 夫 归纳 法 不 可 计算 这 一 糟糕 性 质 恰 好 让 它 逃 脐 了 可 计算 
知识 哲学 的 不 完备 性 定理 。 对 于 所 罗 门 诺 夫 而 言 ， 这 种 不 可 计算 性 并 非 病 态 ， 而 



















































































(D 证 明 的 梗概 就 是 ， 存 在 数据 的 某 种 模式 会 让 进行 预测 的 算法 出 错 。 重 要 的 是 ， 与 所 罗 门 诺 夫 
归纳 法 不 一 样 ， 这 一 模式 是 可 以 计算 的 。 
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是 所 有 合乎 要 求 的 知识 哲学 必 备 的 性 质 。 


对 实用 的 追求 


所 罗 门 诺 夫 令 我 赞叹 ， 同 时 又 让 我 感到 绝望 。 他 的 理论 稳固 地 建立 在 计算 机 
科学 与 概率 论 最 基本 的 概念 之 上 。 所 罗 门 诺 夫 的 构造 自然 得 不 可 思议 。 我 的 意思 
是 ， 这 正 是 我 在 长 期 思考 贝 叶 斯 主义 时 就 开始 考虑 到 的 ， 如 果 我 思考 的 时 间 足 够 
长 ， 而 且 拥 有 足够 的 认 知 能 力 ， 那 么 我 也 会 得 出 同样 的 构造 。 但 与 此 同时 ， 所 罗 
门 诺 夫 得 出 的 结论 却 如 此 一 致 、 直 接 、 出 人 意料 一 一 尽管 我 越 思 考 贝 叶 斯 公式 ， 
就 越 有 这 样 的 预感 ……: 

知识 与 理性 是 我 们 无 法 企及 的 。 这 一 限制 让 我 们 只 能 满足 于 近似 ， 我 们 甚至 
不 知道 怎么 衡量 这 些 近似 的 有 效 性 。 更 不 幸 的 是 ， 因 为 我 们 的 计算 能 力 与 时 间 的 
资源 总 是 有 限 的 〈 这 是 物理 法 则 的 结果 )， 所 以 我 们 只 能 将 自己 限制 在 所 罗 门 庄 夫 
归纳 法 的 一 种 极 粗浅 的 形式 中 。 

而 且 ， 这 样 的 限制 会 随 着 观察 数据 量 的 增长 而 越发 严重 ， 这 就 是 大 数据 的 情 
况 。 今 天 ， 我 们 的 数据 ， 无 论 是 数字 的 还 是 感官 的 ， 都 需要 用 GB、TB PB, EB 
甚至 ZB 来 衡量 "。 也 就 是 说 ， 我 们 在 现实 中 研究 的 数列 a, o a, 包含 着 上 亿 其 至 
上 亿 亿 项 ! 储存 这 样 的 数据 已 经 是 一 种 幻想 ， 而 在 这 种 情况 下 希望 对 其 进行 所 罗 
门 诺 夫 归纳 法 的 近似 计算 就 更 是 痴人说梦 。 因 此 ， 这 会 迫使 我 们 更 加 谦虚 音 慎 01. 
看 对 这 个 令 人 绝望 的 情况 ， 这 本 书 剩 下 的 部 分 与 当今 科学 界 、 统 计 学 界 和 人 
工 智能 学 界 一 样 ， 只 能 满足 于 某 种 启发 性 的 知识 哲学 。 我 们 无 法 得 到 完整 的 知识 ， 
但 我 们 也 许 仍 然 可 以 得 到 足够 的 知识 。 要 做 到 这 一 点 ， 在 知道 如 何 获得 完整 知识 
的 前 提 下 ， 我 们 会 在 本 书 中 尝试 从 所 罗 门 诺 夫 妖 那里 获得 灵感 ， 尽 量 做 到 贴近 它 
的 预测 。 

因此 ， 自 此 之 后 我 希望 引入 另 一 种 哲学 ( 尽管 它 并 不 精确 ) 和 男 一 位 虚构 人 
物 。 这 种 哲学 就 是 实用 贝 叶 斯 主义 ， 这 个 虚构 人 物 就 是 实用 贝 叶 斯 主义 者 。 与 纯 


















































































































































(D GB (gigabyte， 吉 字 节 )、TB (terabyte， 太 字 节 )、PB (petabyte， 拍 字 节 )、EB (exabyte， 艾 字 
节 ) 和 ZB (zettabyte， 泽 字 节 ) 大 约 分 别 对 应 10°, 10^, 10%, 107 和 107 字 节 。 一 一 译 者 注 

















粹 贝 叶 斯 主义 者 相反 ， 实 用 贝 叶 
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斯 主义 者 在 计算 资源 和 储存 空间 方面 都 受到 限制 。 


因此 ， 对 他 来 说 ， 利 用 众多 迅速 、 高 效 的 算法 计算 ， 胜 于 花 大 量 时 间 运 行 窒 容 几 


个 运行 时 间 非 常 长 的 算法 。 所 以 ， 实 用 贝 叶 斯 
实际 上 ， 与 纯粹 贝 叶 
























































主义 者 必须 对 算法 有 着 切实 的 认识 。 
斯 主义 相 比 ， 实 用 贝 叶 斯 主义 所 需 的 关于 计算 和 信息 的 


理论 更 精巧 、 更 先进 ， 我 们 一 般 将 它 称 为 理论 计算 机 科学 ， 而 计算 机 科学 的 实验 




















中 人 们 理解 其 少 ， 却 最 迷人 、 最 有 前 途 的 领域 之 一 。 
信息 科学 并 非 只 是 现代 技术 的 实用 技巧 。 实 际 上 ， 我 立志 成 为 有 能 力 的 贝 叶 









































性 或 经 验 性 领域 中 关于 计算 的 经 验 也 可 以 作为 理论 计算 机 科学 的 补充 。 由 哥 德 尔 、 


丘 奇 和 图 灵 自 20 世纪 30 年 代 起 草创 的 这 个 现代 科学 领域 已 经 成 为 当今 科学 研究 


斯 主义 者 ， 对 贝 叶 斯 主义 者 而 言 ， 要 得 出 最 优 的 使 用 知识 哲学 ， 理 论 计算 机 科学 


的 概念 就 是 最 重要 的 工具 库 一 一 当然 ， 前 提 是 我 们 已 经 确实 得 出 了 正确 的 理想 化 


知识 哲学 。 在 《量子 计算 公开 课 》( Quantum Computing since Democritus ) 一 书 中 ， 


计算 机 科学 家 























斯 科 特 ， 阿 伦 森 甚至 提出 要 将 理论 计算 机 科学 改名 为 量化 认识 论 


( quantitative epistemology )。 他 特别 强调 了 算法 复杂 度 理论 对 于 所 有 知识 哲学 的 重 


要 性 Da, 


然而 ， 我 建议 你 先 将 这 种 对 知识 哲学 的 寻求 放 到 一 边 ， 我 们 会 从 第 14 387] 
重新 花 大 量 篇 幅 来 探讨 这 一 点 。 从 现在 开始 ， 
处 不 在 一 一 无 论 是 在 密码 学 、 社 会 学 、 生 物 学 ， 还 是 在 科学 共识 的 形成 之 中 者 








我 建议 你 先 观察 贝 叶 斯 原则 如 何 无 

















它 的 身影 。 在 后 面 的 几 章 中 ， 我 们 会 稍微 离 姑 
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斯 主义 ， 探 索 一 些 看 似 遥 远 的 


领域 ， 但 我 们 会 一 次 又 一 次 地 发 现 ,在 所 有 这 些 变化 多 端的 现象 背后 ， 实 际 上 总 











是 潜藏 着 贝 叶 革 





折 主 义 的 原则 。 





你 宣称 不 关心 隐私 是 因为 你 没有 什么 好 隐瞒 
的 ， 这 就 像 你 说 不 关心 言论 自由 是 因为 你 没 
什么 好 说 的 。 


敌人 了 解 整 个 系统 。 
克 劳 德 ， 香 农 (1916 一 2001 ) 


uos: 
保守 秘密 


保密 


战争 期 间 ， 高 级 将 领 希望 得 知 士兵 吸食 大 麻 的 比例 。 问 题 在 于 ， 如 果 高 级 将 
领 询 问 士兵 是 否 吸食 大 麻 ， 为 了 避免 被 惩罚 ， 士 兵 基 本 上 会 做 出 否定 的 回答 。 高 
级 将 领 需要 一 份 回 答 者 不 会 被 定罪 的 调查 问卷 ， 而 且 这 份 调查 问卷 要 在 数学 上 保 
证 答案 的 私密 性 。 你 能 否 猿 到 他 们 是 怎么 做 到 这 一 点 的 ? 

在 军队 中 ,保密 是 常见 的 挑战 。 传 说 克利 乌 斯 . 恺 撤 在 收发 信息 时 顺序 蔡 换 
字母 来 加 密 信息 。 字 母 A 被 字母 D 代替 ， 字 母 B 被 字母 已 代替 ，C 被 了 代替 ， 以 
此 类 推 ， 这 叫 作 移 位 密码 。 后 来 的 军队 将 领 利用 更 复杂 的 密码 ， 用 字母 表 中 的 任 
意 字 母 代 替 A， 而 用 另 一 个 字母 蔡 换 B， 等 等 。 我 们 将 这 种 密码 称 为 替换 式 密码 ， 
因为 所 有 字母 都 被 其 他 字母 全 盘 蔡 换 了 。 

与 恺 撤 所 用 的 移 位 密码 不 同 ， 蔡 换 式 密码 的 好 处 在 于 其 可 能 的 编码 方式 是 个 
天 文 数字 。 实 际 上 ， 在 移 位 密码 的 情况 中 ， 可 能 的 编码 方式 总 数 就 是 顺序 替换 字 










































































母 方式 的 总 数 ， 因 为 字母 有 26 个， 所 以 移 位 方式 有 26 种 ( 其 中 一 种 是 不 移 位 )。 
这 样 做 的 问题 在 于 ， 破 译 者 只 需要 测试 26 种 移 位 方法 就 能 解 开 密码 。 

然而 ， 如 果 我 们 允许 任意 替换 字母 的 话 ， 那 么 编码 的 可 能 数目 就 从 根本 上 提 
高 了 。 这 是 因为 ,我们 可 以 将 A 换 成 26 个 字母 中 的 任意 一 个 ， 然 后 将 B 换 成 剩 
下 的 25 个 字母 中 的 任意 一 个 ， 再 将 C 换 成 剩 下 的 24 个 字母 中 的 任意 一 个 ， 以 此 
类 推 。 由 此 ， 我 们 能 看 到 替换 密码 的 数量 是 26x25x24x…x2x1l1， 又 写作 26!( 读 
作 “26 的 阶乘 ” )。 这 个 巨大 的 数字 大 约 在 1025 这 个 量 级 ， 相 当 于 宇宙 中 恒星 的 总 
数 ! 要 在 宇宙 年 龄 之 内 测试 所 有 这 些 可 能 性 ， 即 使 是 计算 机 的 计算 速度 也 不 够 。 
第 二 次 世界 大 战 和 技术 进步 带 来 了 密码 学 的 机 械 化 。 在 纳粹 最 重要 的 战争 机 
器 之 中 ， 有 几 种 机 器 的 用 途 并 不 是 直接 杀 玖 ， 而 是 对 秘密 信息 编码 和 解码 。 这 些 
机 器 就 是 我 们 在 第 6 章 谈 到 过 的 恩 尼 格 玛 密码 机 和 洛 仑 效 密 码 机 。 这 些 机 器 包含 
的 组 合 方式 同样 数不胜数 ， 要 测试 所 有 组 合 简直 是 妄想 。 
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今天 的 密码 学 


自 此 之 后 ， 技 术 环 境 的 改变 让 我 们 得 到 了 互相 联网 的 超级 计算 机 。 人 们 每 天 
通过 互联 网 发 送 上 亿 条 信息 。 为 了 保证 这 些 信息 的 私密 性 ， 密 码 学 变 得 空前 重要 。 

我 们 需要 接收 朋友 的 电子 邮件 ,但 要 保证 任何 人 都 无 法 监视 。 我 们 需要 连 入 
社交 网 络 , 但 要 保证 任何 人 都 不 能 假冒 我 们 。 我 们 需要 向 银行 提出 金融 交易 的 请 
求 ， 而 银行 必须 能 够 证 实 这 些 请 求 的 确 来 自 客户 ， 而 不 是 有 人 冒名 项 禁 。 

密码 学 就 是 这 些 日 常生 活 问题 的 解决 方法 。 正 因为 有 了 密码 学 ， 贸 易 双 方 
才能 享受 一 条 全 新 的 信息 交流 渠道 ， 它 让 商业 交易 变 得 更 便捷 。 如 果 没 有 它 ， 
PayPal, WEH, WK (Netflix )、 优 步 ( Uber ) 和 爱 彼 迎 (Airbnb ) 等 大 量 企 业 
就 不 可 能 面世 上品。 

这 一 类 密码 学 本 质 上 依靠 的 是 1976 年 和 1977 年 的 两 项 大 发 明 : 第 一 项 是 惠 
RIEKIE - 迪 菲 和 马丁 ' 赫 尔 曼 提出 的 迪 菲 - 赫 尔 曼 密 钥 交 换 ， 第 二 项 是 罗 纳 
德 . 李维斯 特 、 阿 迪 “' 沙 米尔 和 伦 纳 德 ， 阿 德 曼 提出 的 RSA 加 密 算法 。 迪 菲 - 赫 





































































































112 | 贝 叶 斯 的 博弈 ; 数学 、 思 维 与 人 工 智能 





尔 曼 密 钥 交换 非常 巧妙 , 让 爱丽 丝 和 鲍 近 “能 通过 互联 网 上 的 公开 通信 来 创造 一 项 
共享 的 秘密 信息 。 借 助 这 一 共享 的 秘密 信息 ， 爱 丽 丝 和 鲍 勃 就 能 决定 一 种 共 
有 的 加 密 方式 ， 然 后 用 它 通 过 互联 网 进行 安全 的 通信 ， 即 使 他 们 在 现实 中 从 未 碰 
面 过 ! 

HSE — 赫 尔 曼 密 钥 交换 此 后 被 用 于 大 量 诸如 WhatsApp 的 应 用 之 中 。 这 一 协议 
能 在 数学 上 保证 即使 是 拥有 这 些 应 用 的 企业 也 不 可 能 阅读 人 们 的 加 密 通信 ?2 。 今 天 ， 
我 们 倾向 于 认为 这 是 理所当然 的 ， 但 在 迪 菲 - 赫 尔 曼 协议 发 明之 前 ， 这 一 点 是 否 
终 有 一 天 会 实现 还 曾 是 未 知之 数 。 

另外 ，RSA 加 密 算法 打开 了 非 对 称 密码 学 的 大 门 。 在 使 用 RSA 时 ， 爱 丽 丝 
应 先生 成 一 对 密 钥 ， 并 将 公 钥 公开 ， 将 私 钥 保密 。 然 后 饱 勃 或 其 他 人 利用 爱丽 丝 
的 公 钥 进行 加 密 就 可 以 向 爱丽 丝 发 送 加 密 的 信息 。 只 有 爱丽 丝 能 够 解密 这 些 信息 ， 
因为 解密 必须 用 到 私 钥 。 

更 妙 的 是 ， 爱 丽 丝 也 可 以 对 她 发 给 鲍 勃 的 信息 “签名 ”， 只 要 将 信息 〈 的 散 列 
摘要 ) 用 私 钥 加 密 就 可 以 了 。 如 果 鲍 勃 能 用 爱丽 丝 的 公 钥 解密 这 条 信息 ， 那 么 他 
就 会 知道 只 有 爱丽 丝 能 发 出 这 样 的 信息 。 这 是 因为 ， 要 将 信息 ( 的 散 列 摘要 ) 加 
密 成 可 以 用 公 角 解密 的 密 文 ， 私 钥 是 必 不 可 少 的 。 用 这 种 方式 对 信息 “签名 ”的 
话 ， 爱 丽 丝 就 可 以 认证 自己 的 身份 ， 向 银行 或 者 社交 网 络 证 明 它 们 收 到 的 信息 的 
确 来 自 本 人 而 不 是 有 人 冒名 顶替 。 

在 刚才 走马 观 花 看 到 的 所 有 密码 学 的 例子 之 中 ， 安 全 性 都 是 由 编码 方式 的 海 

能 性 以 及 任何 破译 者 都 需要 尝试 其 中 大 部 分 可 能 性 的 假设 来 保证 的 。 这 样 的 

话 ， 如 果 一 共有 107 种 可 能 性 ， 即 使 破译 者 能 排除 99% 的 可 能 性 ， 那 么 破译 者 还 
需要 测试 剩 下 的 1079 种 ， 即 使 是 现代 计算 机 也 需要 花 上 很 长 时 间 才 能 破译 。 

然而 ， 这 些 论证 都 忽略 了 贝 叶 斯 主义 者 最 喜欢 的 两 件 工 具 : 偏见 与 贝 叶 斯 公式 。 



































































































































(D 密码 学 传统 上 将 通信 双方 称 为 爱丽 丝 ( Alice ) 和 鲍 勃 (Bob )， 而 尝试 窃听 双方 通信 的 第 三 方 
被 称 为 伊美 ( Eve )。 一 一 译 者 注 

Q ”实际 上 ， 这 个 结论 依赖 于 一 个 未 被 证 明 的 猜想 ， 也 就 是 离散 对 数 问题 不 可 能 在 多 项 式 时间 内 
解决 ， 此 外 还 依赖 于 量子 计算 机 仍 未 出 现 的 事实 。 























用 贝 叶 斯 主义 破译 密码 














1568 年 5 月 2 日 ， 几 经 波折 ,苏格兰 女王 玛丽 : 斯 图 亚 特 流亡 海外 ， 希 望 到 
英格兰 的 表亲 那里 寻求 庇护 。 但 因为 天 主教 徒 认为 ， 对 于 这 个 刚刚 将 新 教 定 为 国 
教 的 国家 ,玛丽 才 是 王座 的 正统 继承 者 ， 所 以 她 的 表亲 英格兰 女王 伊丽莎白 一 世 
将 她 视 为 政敌 ， 在 接 下 来 的 19 年 内 一 直 将 她 囚禁。 

玛丽 正 是 在 监狱 中 开始 熟悉 密码 学 的 。 因 为 其 通信 被 女王 的 手下 截 查 ， 玛 丽 
总 是 利用 替换 密码 来 进行 秘密 通信 ， 特 别 是 与 一 位 叫 安东尼 “' 巴 宾 顿 的 人 。 然 而 ， 
这 些 密 信 似乎 最 终 都 被 破译 了 ， 其 中 暴露 了 谋杀 女王 的 密谋 。 这 项 密谋 被 叫 作 
“ 巴 宾 顿 阴谋 ”， 东 窗 事 发 后 ， 玛 丽 最 终 在 1387 年 2 月 8 日 被 处 死 。 

然而 ， 在 没有 计算 机 的 情况 下 ， 这 些 替 换 密码 是 如 何 被 破译 的 ” 我们 之 前 看 到 ， 
替换 密码 的 总 数 要 比 宇宙 中 的 恒星 还 要 多 ， 所 以 如 果 伊 丽 落 白 一 世 女 王 的 手下 要 全 部 
测试 所 有 可 能 性 ， 那 就 根本 不 可 能 破译 玛丽 的 密 信 。 为 破译 替换 密码 ， 女 王 的 手下 利 
用 了 他 们 的 偏见 ， 而 在 破译 玛丽 密码 的 情况 中 ， 他 们 用 到 的 就 是 关于 英语 的 偏见 。 

在 英语 中 ,字母 E、T、A、O 和 I 比 其 他 字母 出 现 得 更 频繁 。 因 此 ， 密 信 中 
出 现 得 最 多 的 字母 有 可 能 就 是 由 字母 E 替换 而 来 的 ， 而 出 现 得 第 二 频繁 的 字母 可 
能 替换 的 就 是 IT， 以 此 类 推 。 但 还 不 止 于 此 ! 英语 中 的 单词 非常 固定 ， 因 此 能 组 
成 单词 的 字母 组 合 少 之 又 少 。 这 样 的 话 ， 一 旦 我 们 解码 出 “T*E”， 要 确定 缺失 的 
字母 “*” 是 什么 ,我 们 就 会 猜 “*” 很 可 能 是 也、I 或 者 0O。 更 厉害 的 是 ， 如 果 这 
是 某 个 句子 的 第 一 个 单词 ， 我 们 可 以 非常 肯定 它 就 是 Ho 

可 以 看 到 ， 概 率 的 语言 突然 自行 出 现 了 。 实 际 上 ， 刚 才 提 出 的 那些 直觉 论证 

背后 都 隐藏 着 贝 叶 斯 公式 。 这 就 相当 于 给 定 了 加 密 后 的 信息 ， 计 算 我 们 对 于 原文 
以 及 加 密 编码 的 置信 度 。 换 名 话说 ， 这 就 相当 于 在 给 定 结果 的 条 件 下 推断 原因 。 
这 正 是 贝 叶 斯 公式 适用 的 场景 。 
正 是 出 于 类 似 的 原因 ， 随 机 生成 的 密码 要 比 “123456” 更 安全 。 黑 客 对 于 用 
户 选 取 的 密码 有 一 种 合理 的 偏见 ， 因 为 他 们 知道 某 些 密 码 比 其 他 密码 出 现 得 更 频 
繁 。 一 位 狐 独 的 黑客 运行 的 算法 就 会 先 测试 那些 最 有 可 能 的 密码 。 在 第 二 次 世界 
大 战 中 ， 图 灵 的 那些 破译 密码 的 机 器 也 利用 了 相同 的 原则 。 
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当然 ， 在 玛丽 的 置换 密码 这 个 例子 中 ， 能 够 作为 原因 的 集合 非常 庞大 ， 这 使 
人 类 不 可 能 完成 相应 的 贝 叶 斯 计算 。 然 而 ， 密 信和 是 逐 字 母 加 密 的 这 一 事实 让 人 们 
能 将 编码 的 集合 分 组 ， 从 而 简化 密码 的 分 析 。 说 穿 了 ， 就 是 我 们 可 以 先 考 虑 EE 被 
替换 成 了 什么 字母 ， 然 后 再 考虑 工 ， 以 此 类 推 。 
图 灵 尝 试 破译 恩 尼 格 玛 密码 机 和 洛 仑 兹 密码 机 的 时 候 可 没有 这 种 优良 条 件 。 
为 了 破译 这 些 更 复杂 的 密码 ， 图 灵 首 先 利 用 后 面 章节 会 讲 到 的 对 数 标 度 ， 将 贝 叶 
斯 计算 进行 了 形式 化 。 伟 大 的 克 劳 德 ， 香农 之 后 将 图 灵 的 计算 严格 化 ， 由 此 发 展 
出 了 关于 通信 与 密码 学 的 数学 理论 。 

自 此 ,计算 机 科学 家 非常 注意 不 让 加 密 信息 拥有 任何 能 用 于 破译 密码 的 性 质 ， 
比如 我 们 刚才 谈 到 的 那些 性 质 。 有 趣 的 是 ， 正 如 香农 发 现 的 那样 ， 为 了 达到 这 个 
目标 ， 一 个 好 方法 就 是 首先 将 原始 信息 尽 可 能 压缩 。 这 是 因为 在 将 信息 压缩 的 同 
时 ， 我 们 能 够 摧毁 其 中 的 刚性 结构 ， 比 如 “T*E” 这 个 单词 中 的 星 号 只 能 对 应 罕 究 
几 个 字母 的 事实 。 

今天 ， 只 要 量子 计算 机 仍 未 面世 ， 由 香农 、 迪 菲 - 赫 尔 曼 和 李维斯 特 - 沙 米 
尔 一 阿 德 曼 的 数学 出 发 构建 的 密码 体系 在 数学 上 就 被 认为 是 安全 的 。 有 人 也 提出 
了 其 他 更 稳固 的 密码 体系 ,它们 又 叫 后 量子 密码 体系 。 然 而 ,我 们 仍 未 证 明 任何 
算法 ,无论 是 经 典 算法 还 是 量子 算法 ， 都 无 法 破译 这 些 密 码 ， 而 该 问题 和 “P 对 
NP” 这 一 车 名 问题 有 着 紧密 的 联系 。 





















































































































































随机 调查 问卷 


但 是 ， 所 有 这 些 密码 学 都 无 法 解决 高 级 将 领 调查 士兵 吸食 大 麻 的 问题 。 士 兵 
当然 可 以 对 回答 进行 加 密 ， 但 如 果 某 个 人 将 这 些 回答 解密 ， 那 么 回答 的 私密 性 就 
被 破坏 了 ， 而 士兵 也 会 拒绝 诚实 作答 "。 然 而 ， 如 果 没 有 人 能 解密 这 些 回 答 ， 那 么 

















© 我 们 可 以 想象 有 一 个 瓶子 ， 让 士兵 匿名 投放 他 们 回答 的 问卷 。 然 而 ,我们 之 后 会 看 到 ， 匿 名 
性 (一 般 来 说 ) 并 不 能 保证 私密 性 。 比 如 说 ， 有 可 能 对 瓶子 做 了 手脚 ， 里 边 除了 菜 位 士兵 的 
回答 之 外 ， 其 他 都 是 否定 的 回答 。 这 样 一 来 ， 就 可 以 通过 瓶子 里 有 没有 肯定 的 回答 来 确定 这 
位 士兵 的 回答 。 


























这 个 问题 就 毫 无 进展 ， 因 为 他 们 什么 都 不 会 知道 。 

在 某 种 意义 上 ， 我 们 希望 让 高 级 将 领 能 够 知道 关于 士兵 的 某 些 信息 ， 但 无 法 
知道 任何 一 位 士兵 的 具体 信息 。 

有 一 个 绝妙 的 技巧 就 是 将 回答 随机 化 。 更 准确 地 说 ， 每 位 士兵 在 回答 之 前 都 
要 先 抛 一 枚 硬币 。 如 果 背 面向 上 ， 那 就 诚实 作答 ; 如 果 正 面向 上 ， 那 就 做 出 肯定 
的 回答 。 最 重要 的 是 ， 当 高 级 将 领 询问 某 位 士兵 有 没有 吸食 大 麻 时 ， 他 不 知道 也 
永远 不 可 能 知道 硬币 是 正面 向 上 还 是 反面 向 上 的 。 这 样 一 来 ， 就 算 士兵 的 回答 是 
肯定 的 ， 高 级 将 领 也 不 可 能 知道 肯定 回答 的 原因 到 底 是 士兵 吸食 大 床 ， 还 是 抛 的 
硬币 正面 向 上 。 换 句 话 说， 士兵 有 一 个 可 行 的 借口 来 抵赖 。 但 是 如 果 将 不 同 士兵 
的 回答 收集 起 来 ， 将 领 就 能 够 得 知 士兵 中 吸食 大 麻 的 比例 。 
原因 在 于 ,假设 收集 的 问卷 有 200 份 ， 其 中 160 份 的 回答 为 肯定 ， 其 余 40 份 
的 回答 为 否定 ， 因 为 我 们 知道 所 有 回答 中 约 一 半 是 出 于 抛 硬币 正面 朝 上 ， 而 这 就 
是 士兵 做 出 肯定 回答 的 原因 。 所 以 ， 肯 定 回答 之 中 大 约 有 100 份 是 被 硬币 决定 的 。 
剩 下 的 问卷 有 100 份 ， 其 中 有 60 份 为 肯定 回答 40 份 为 否定 回答 ， 这 些 回答 都 是 
诚实 的 。 也 就 是 说 , 我 们 可 以 推断 出 大 约 60% 的 士兵 吸食 了 大 麻 “。 我 们 成 功 对 士 
兵 进 行 了 调查 ， 又 没有 暴露 任何 一 位 士兵 的 隐私 P 

其 实 并 不 尽 然 。 如 果 我 们 用 贝 叶 斯 的 方式 思考 的 话 ， 就 会 察觉 我 们 关于 某 位 
随机 抽 选 的 士兵 吸食 大 麻 的 先 验 概率 发 生 了 变化 。 这 样 的 话 ， 在 调查 之 前 ， 高 级 
将 领 可 能 认为 有 20% 的 士兵 吸食 大 麻 。 调 查 结果 可 能 大 大 改变 了 将 领 对 某 位 随机 
抽取 的 士兵 吸食 大 麻 的 偏见 ， 它 从 原来 20% 的 概率 变 成 了 大 概 60%。 当 然 这 并 不 
惊人 ， 毕 况 这 就 是 调查 的 目的 。 

然而 困难 在 于 ， 将 领 难免 对 在 问卷 中 做 出 肯定 回答 的 受 访 士 兵 心 生 疑 虑 。 这 
是 因为 ， 如 果 士 兵 做 出 了 肯定 而 非 否定 的 回答 ， 他 吸食 大 麻 的 可 能 性 还 是 大 于 做 
出 否定 回答 甚至 没有 回答 的 人 。 要 计算 遵循 贝 叶 斯 主义 的 将 领 对 于 做 出 肯定 回答 
的 士兵 吸食 大 麻 的 置信 和 度 ， 我 们 还 是 要 应 用 下 面 的 贝 叶 斯 公式 : 
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中 ”作为 合格 的 贝 叶 斯 主义 者 ,我们 实际 上 应 该 应 用 在 第 6 章 看 到 的 拉 普 拉 斯 接续 法 则 ， 这 会 给 
出 61/102 的 结果 ,或 者 应 该 从 比 拉 普 拉 斯 拥有 更 多 信息 的 偏见 出 发 。 此 外 ， 不 要 忘记 同样 应 
该 计算 这 样 得 到 的 比例 的 不 确定 性 ! 
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我 在 这 里 替 你 算 好 了 。( 但 还 是 请 你 自己 也 算 一 下 ! ) 根据 上 面 的 数据 ， 将 领 
对 于 某 位 做 出 肯定 回答 的 士兵 的 确 吸 食 了 大 麻 的 置信 和 度 应 该 是 75%。 这 个 结果 与 
对 没有 参加 调查 的 士兵 的 60% 置信 度 形 成 了 强烈 对 比 。 换 句 话 说， 士兵 一 旦 接受 
问卷 调查 ， 就 会 受到 轻微 的 责备 。 其 隐私 即使 没有 被 完全 侵犯 ， 也 并 没有 被 完全 
保密 。 

反 过 来 说 ， 士 兵 的 隐私 在 另 一 种 情况 下 就 被 完全 侵犯 了 ， 那 就 是 做 出 否定 回 
答 的 情况 。 这 是 因为 ， 假 设 这 位 士兵 没有 撒谎 ， 将 领 就 能 肯定 他 没有 吸食 大 麻 。 
然而 ， 这 实际 上 可 能 是 一 个 严重 的 问题 ， 因 为 出 于 神秘 的 原因 ， 未 来 研究 也 许 会 
发 现 被 送 往 战场 而 没有 吸食 大 麻 的 士兵 患 上 结肠 癌 的 概率 极 高 ， 于 是 保险 公司 会 
希望 提高 那些 确定 没有 吸食 过 大 麻 的 士兵 的 保险 费 。 

为 了 不 侵犯 任何 人 的 隐私 ,我们 必须 修正 调查 机 制 。 为 此 ， 在 硬币 正面 向 上 
的 情况 下 ， 士 兵 此 时 应 该 抛 第 二 次 硬币 ， 这 就 决定 了 他 的 回答 。 换 句 话说， 在 这 
种 修正 中 ， 所 有 士兵 都 有 二 分 之 一 的 机 会 诚实 作答 ， 在 四 分 之 一 的 情况 下 由 于 抛 
硬币 结果 而 做 出 肯定 回答 ， 在 另外 四 分 之 一 的 情况 下 由 于 抛 硬币 结果 而 做 出 否定 
回答 。 跟 之 前 一 样 ， 我 们 知道 将 领 可 以 确定 士兵 吸食 大 麻 的 比例 。 

此 外 ， 如 果 跟 之 前 一 样 应 用 贝 叶 斯 公式 的 话 ， 将 领 对 于 某 位 做 出 肯定 回答 的 
士兵 确实 吸食 了 大 麻 的 后 验 置信 和 度 就 是 82%。 而 反 过 来 的 话 ， 这 次 将 领 对 于 某 位 
做 出 否定 回答 的 士兵 却 吸 食 过 大 麻 的 置信 和 度 就 不 是 0 了， 而 是 33%。 这 两 个 数值 
当然 都 应 该 与 对 没有 参加 调查 的 士兵 吸食 大 麻 的 置信 度 60% 进行 比较 。 人 们 尤其 
习惯 用 比值 82/60 和 60/33 来 衡量 私密 性 。 在 这 个 情况 下 ， 私 密 性 的 损失 因子 不 会 
超过 2。 






























































































































































随机 调查 的 私密 性 





我 们 在 这 里 计算 的 这 些 比值 依赖 于 吸食 大 麻 的 人 数 的 比例 ， 即 60%。 然 而 将 
领 在 调查 之 前 不 可 能 预计 到 这 一 点 。 从 这 一 项 观察 出 发 ， 理 论 计算 机 科学 家 辛 西 





W - 德 沃 克 发 明了 一 个 新 理论 ， 用 以 从 数学 的 角度 研究 隐私 。 这 个 理论 的 核心 就 
是 差分 隐私 (differential privacy )。 

与 我 们 之 前 的 分 析 恰 好 相反 ， 差 分 隐私 的 目的 是 在 士兵 接受 调查 之 前 就 保证 
某 种 程度 的 隐私 。 换 句 话 说 ， 这 个 概念 希望 确定 ， 无 论 吸食 大 麻 的 士兵 比例 如 何 ， 
将 领 必须 让 接受 调查 的 士兵 承受 的 最 严重 的 隐私 损失 是 多 少 EL 

假设 有 1% 的 士兵 吸食 大 麻 ， 考虑 某 位 做 出 肯定 回答 的 士兵 ， 他 的 确 吸食 过 
大 麻 的 后 验 置 信和 度 可 以 用 贝 叶 斯 公式 计算 出 来 : 
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这 一 置信 和 度 几 乎 是 在 这 位 士兵 没有 回答 的 情况 下 的 3 倍 ! 实际 上 ， 在 吸食 大 麻 的 
士兵 比例 趋向 于 零 的 极限 情况 下 ， 这 个 倍数 恰好 等 于 3。 这 也 是 最 粳 糕 的 情况 。 我 
们 说 抛 两 次 硬币 的 随机 调查 是 (In3)- 差分 隐私 的 。 

EDEN + 德 沃克 的 差分 隐私 与 目前 仍 被 广泛 采用 的 朴素 假名 化 方法 "形成 了 强 
烈 对 比 ， 尤 其 是 在 流行 病 学 中 ， 朴 素 假名 化 就 是 将 被 调查 者 的 真实 名 字 隐 去 。 然 
而 ， 如 果 我 们 知道 某 个 人 的 年 龄 、 性 别 、 地 址 、 社 会 经 济 地 位 、 饮 食 习 惯 或 者 教 
育 水 平 的 话 ， 那 么 一 般 来 说 将 这 些 信 息 与 网 上 能 访问 的 其 他 数据 进行 交叉 印证 就 
可 以 确定 这 个 人 的 身份 。 假 名 化 毫 无 隐私 保证 。 












































差分 隐私 的 定义 * 








ERU + 德 沃 克 的 差分 隐私 是 一 项 非常 普 适 的 准则 ， 用 于 识别 那些 可 以 证 明 
提供 了 隐私 保证 的 调查 方法 。 与 随机 调查 的 情况 一 样 ， 想 象 一 下 你 现在 希望 研究 
不 同 个 体 的 数据 来 提取 有 用 的 信息 。 这 样 做 的 话 ， 一 旦 得 知 了 有 用 信息 ， 你 的 后 
置信 度 一 般 来 说 就 会 与 偏见 产生 分 歧 ， 毕 况 这 就 是 提取 有 用 信息 的 目的 。 然 而 
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D 在 隐私 领域 ,假名 化 (pseudonymization) 与 匿名 化 (anonymization) 是 两 个 相似 的 概念 。 
“假名 化 ” 意 即 将 数据 的 某 些 部 分 用 代号 代替 ， 而 “匿名 化 ” 则 是 对 数据 中 可 以 辨识 个 人 的 信 
息 进 行 修改 ， 使 数据 无 法 直接 或 间接 用 于 识别 个 人 。 一 一 译 者 注 
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从 直觉 上 来 说 ， 私 密 性 要 求 你 的 后 验 置信 和 度 不 能 区 分 被 研究 的 个 体 ， 不 管 是 群体 














内 部 的 区 分 ， 还 是 研究 个 体 与 数据 未 被 分 析 的 群体 之 间 的 区 分 。 


正 是 如 此 。 对 于 某 个 提取 信息 的 机 制 ， 如 果 被 分 析 的 个 体 的 后 验 概率 与 未 被 
分 析 的 个 体 总 是 差不多 ， 那么 我 们 就 说 它 是 差分 隐私 的 。 根 据 传递 性 ， 这 同样 意 
味 着 被 分 析 的 个 体 之 间 存 在 无 法 区 分 性 。 比 如 说 ,假设 爱丽 丝 和 查理 都 被 分 析 了 ， 
而 鲍 勃 没有 接受 分 析 ， 那 么 根据 差分 隐私 性 的 定义 ， 爱 丽 丝 和 鲍 勃 的 后 验 置信 和 度 
必然 是 相似 的 ， 而 鲍 勃 和 查理 之 间 也 是 如 此 ， 于 是 爱丽 丝 和 查理 也 就 拥有 相似 的 

















后 验 置信 度 了 。 











利用 更 严格 的 描述 ， 在 不 失 普 遍 性 的 情况 下 ， 德 沃克 假设 被 分 析 的 个 体 的 数 





差分 隐私 。 要 做 到 这 一 点 的 诀窍 在 于 ， 除 了 少数 几 个 已 被 证 明 : 
机 制 以 外 ， 禁 止 数据 库 被 其 他 任何 方式 读 取 。 





最 极端 的 情况 当然 是 这 样 的 提取 机 制 不 存在 ， 这 等 价 于 所 有 提取 机 制 返回 的 
信息 都 与 数据 库 完 全 无 关 。 在 这 种 情况 下 ， 我 们 无 法 提取 关于 数据 库 内 容 的 任何 
信息 。 这 完全 等 同 于 数据 库 根 本 不 存在 ,或 者 数据 库 被 加 密 但 没有 人 能 够 解密 的 














情况 。 此 时 数据 库 显然 是 完全 私密 的 ， 但 它 也 一 点 用 处 都 没有 。 


据 都 存放 在 所 谓 的 数据 库 之 中 。 对 于 德 沃 克 而 言 ， 需 要 保证 的 正 是 这 一 数据 库 的 

















有 差分 隐私 性 的 

















实际 上 ， 普 遍 来 说 ， 没 有 任何 方法 能 提取 某 些 有 用 信息 而 不 至 少 部 分 侵犯 数 











据 的 私密 性 。 德 沃克 的 研究 工作 正 是 对 有 用 信息 提取 与 隐私 之 间 取 舍 的 量化 。 粗 
略 地 说 ， 某 个 提取 信息 机 制 丢失 的 差分 隐私 数量 可 以 用 两 个 参数 a 和 6 来 衡量 。 
一 个 (e=0,6=0) - 差分 隐私 的 机 制 就 能 完美 保证 隐私 ,但 也 无 法 提取 任何 信息 。 








现在 就 只 剩 下 s 和 5 的 定义 了 。 为 此 ， 我们 回 到 一 开始 的 直觉 定义 上 。 我 们 
之 前 看 到 ， 对 处 于 数据 库 中 的 爱丽 丝 与 处 于 数据 库 外 的 鲍 勃 ， 差 分 隐私 的 机 制 不 
应 该 使 他 们 在 后 验 置信 度 上 产生 区 分 。 要 做 到 这 一 点 的 办 法 就 是 保证 即使 将 爱丽 
丝 的 数据 从 数据 库 中 删 去 ， 查 询 机 制 返回 的 结果 在 本 质 上 仍然 与 之 前 的 结果 一 样 























(因此 也 不 可 能 与 饱 勃 区 分 )。 

















更 准确 地 说 ， 令 外 为 一 开始 包含 爱丽 丝 的 数据 库 , 了 为 去 除 爱丽 丝 的 数据 后 得 
到 的 数据 库 , 令 R 为 查询 机 制 返回 的 结果 。 拥 有 差分 隐私 性 的 机 制 对 于 数据 库 忒 
和 了 返回 的 结果 RR 都 应 该 是 相似 的 ， 而 s。 和 5 这 两 个 参数 衡量 的 就 是 这 种 相似 性 。 


























用 符号 来 说 的 话 ， 对 于 数据 库 中 的 某 个 查询 机 制 ， 无 论 我 们 考虑 的 是 什么 数 
据 库 ， 如 果 数 据 库 中 的 某 个 个 体 与 数据 库 以 外 的 个 体 相 比 ， 其 某 种 给 定 特性 的 置 
信和 度 至 少 以 1-6 的 大 概率 变 为 至 多 e* 倍 的 话 ， 那 么 我 们 就 说 这 个 机 制 是 (s, 0) - À 
分 隐私 的 了。 换 句 话说 ,对 于 后 验 置 信和 度 来 说 , 爱丽 丝 就 像 根 本 不 在 数据 库 之 中 一 样 。 

严格 地 说 ， 差 分 隐私 可 以 写成 在 数学 上 更 容易 处 理 的 不 等 式 。 某 个 返回 结果 
R 的 机 制 是 (e, 6) - 差分 隐私 的 ， 当 且 仅 当 对 于 所 有 数据 库 世 和 了， 如 果 两 者 的 差 
异 只 是 添加 或 者 去 除了 某 个 个 体 的 数据 时 ， 那 么 就 有 不 等 式 : 

P[R|X] < P[R|Y] + ó 












































作为 特殊 情况 ,我们 可 以 证 明 ， 为 了 保证 差分 隐私 性 ， 返 回 的 结果 R 应 该 是 关于 
数据 库 的 一 个 随机 函数 。 也 就 是 说 ， 如 果 进 行 两 次 相同 的 差分 隐私 查询 ， 那 么 两 
次 查询 返回 不 同 结果 的 概率 必 不 为 0。 




















拉 普 拉 斯 型 机 制 





差分 隐私 可 能 看 起 来 很 累 资 ， 然 而 它 在 某 些 应 用 中 其 实 也 并 不 麻烦 。 所 谓 拉 
普 拉 斯 型 机 制 就 是 一 个 典型 例子 ， 它 能 让 我 们 进行 满足 差分 隐私 性 的 调查 ， 并 能 
给 出 完全 可 以 接受 的 结果 。 

举 个 例子 ,假设 你 是 一 家 拥有 患者 信息 的 医院 。 你 希望 在 不 泄露 患者 隐私 的 
情况 下 计算 肺癌 患者 的 比例 。 为 此 ， 与 其 直接 查 出 数据 库 中 患 有 肺癌 的 患者 总 数 ， 
不 如 向 这 个 总 数 加 上 一 个 根据 拉 普 拉 斯 概率 分 布 抽取 的 随机 数 作为 扰动 ， 然 后 揭 
晓 这 一 随机 处 理 的 结果 。 

我 就 不 在 这 里 详细 介绍 拉 普 拉 斯 概率 分 布 了 人 “， 你 只 需要 知道 它 取决 于 某 个 参 
数 ， 也 就 是 对 结果 扰动 的 典型 大 小 。 要 达到 (e, 6=0)- 差分 隐私 性 ， 这 项 扰动 大 概 
应 该 处 于 Ie 量 级 。 这 样 的 话 ， 如 果 某 个 拉 普 拉 斯 型 机 制 回 应 说 有 243 位 肺癌 病 
人 ， 你 就 知道 这 个 数目 并 不 对 ， 真 正 的 数目 应 该 差不多 是 243 土 1/e。 








































































































(D 在 之 前 随机 调查 的 情况 中 ,我 们 有 5=0，s=ln3。 














Q 它 的 概率 密度 函数 是 ftx)= 5 exp(- bx), KEI Ż 2b. 
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这 似乎 不 太 令 人 满意 ， 但 是 我 们 必须 将 这 种 不 确定 性 与 任何 调查 都 会 有 的 统 
计 涨 落 进行 比较 。 假 设 我 们 随机 调查 了 500 个 人 ， 这 样 的 抽样 只 是 刚刚 有 一 点 代 
表 性 。 实 际 上 ， 如 果 整 体 人 口 患 有 肺癌 的 比例 是 n/500， 那 么 每 调查 500 À, RN 
预计 有 大 约 nt Vn 个 人 患 有 肺癌 ?。 因 此 ,调查 的 不 确定 性 大 概 在 Vn 这 个 量 级 。 

这 样 一 来 ， 如 果 我 们 预期 发 现 n NAR, 那么 就 可 以 根据 的 数值 来 调整 
差分 隐私 所 需 的 不 确定 性 ， 取 1/e= Yn ， 也 就 是 e=1/Yn 。 这 时 ,我 们 可 以 保证 
(1/Vn, 0)- 差分 隐私 性 ， 而 本 质 上 并 没有 降低 调查 的 准确 性 。 特 别 是 如 果 调 查 的 人 
数 众多 ， 那 么 它 就 几乎 是 完全 私密 的 。 

































































组 合 健壮 性 





近 十 年 来 ，(s, 0)- 差分 隐私 已 成 了 计算 机 科学 中 被 研究 得 最 多 而 又 最 激动 人 
心 的 概念 之 一 。 除 了 人 们 在 直觉 上 认 知 到 这 个 概念 的 重要 性 以 外 ,我们 也 可 以 将 
它 的 逐步 流行 归结 于 差分 隐私 机 制 的 两 个 基本 性 质 : 与 后 续 计 算 组 合 后 的 健壮 性 ， 
以 及 隐私 损失 的 逐步 可 加 性 。 

首先 来 看 一 下 组 合 健壮 性 。 我 们 之 前 看 到 ， 对 数据 进行 朴素 假名 化 的 缺陷 在 
于 ， 通 过 查阅 其 他 数据 集 ， 人 们 有 可 能 利用 相关 的 元 数据 ， 也 就 是 年 龄 、 性 别 、 
地 址 等 与 数据 相关 联 的 信息 进行 交叉 印证 ， 从 而 将 数据 去 匿名 化 。 比 如 说 ， 这 样 
的 技术 曾 被 用 于 追踪 使 用 匿名 地 址 的 恶意 账户 的 持 有 人 。 

在 这 里 要 记 住 的 是 ， 即 使 是 精心 构思 出 的 数据 假名 化 方法 ， 也 并 不 一 定 能 
证 隐私 。 即 使 某 种 假名 化 方法 在 数据 发 布 时 似乎 够 用 ， 也 不 能 保证 将 这 些 数据 与 
其 他 信息 结合 起 来 之 后 ， 仍 然 能 够 保证 这 一 方法 的 健壮 性 。 

假名 化 的 这 一 弱点 正 是 差分 隐私 的 力量 。 无 论 是 在 调查 结果 刚 公 开 时 ， 还 是 
在 数 个 世纪 之 后 将 这 些 公 开 结果 与 其 他 数据 库 进 行 交叉 印证 时 ， 差 分 隐私 机 制 对 
于 经 其 处 理 的 数据 仍然 有 相同 的 隐私 保证 。 

即使 在 极端 情况 下 ， 这 种 隐私 保证 仍 能 保留 下 来 。 想 象 一 下 ， 爱 丽 丝 同意 了 



























































CD ”这 个 结果 来 自 中 心 极限 定理 ,或 者 对 于 概率 学 的 纯粹 主义 者 来 说 ， 该 结果 也 可 以 通过 类 似 切 
尔 诺 夫 不 等 式 的 集中 不 等 式 来 推导 。 
































向 某 项 研究 贡献 数据 ， 但 参加 这 项 研究 的 其 他 个 体 其 实 都 是 虚构 出 来 的 ， 他 们 的 信 
息 都 是 已 知 的 。 即 使 数据 库 中 除了 爱丽 丝 以 外 的 个 体 数据 都 是 已 知 的 ， 只 要 这 个 数 
据 库 的 唯一 访问 方式 是 (s, 0)- 差分 隐私 的 话 ， 那 么 爱丽 丝 的 数据 仍然 是 (s, 6)- 差 
分 隐私 的 ! 

无 论 爱丽 丝 的 数据 是 否 处 于 数据 库 中 ,在 这 两 种 情况 下 对 于 爱丽 丝 的 置信 和 度 
的 变化 幅度 不 会 超过 ec 的 概率 至 少 是 1-5。 无 论 是 在 查询 机 制 得 出 的 结果 刚刚 被 
公布 之 时 ， 还 是 在 经 过 数 个 世纪 这 项 结果 与 其 他 数据 集 进 行 了 交 义 印证 之 后 ， 这 
一 点 都 成 立 。 















































隐私 损失 的 可 加 性 


当然 ， 只 有 在 数据 库 仅仅 允许 之 前 说 到 的 (e, 0) - 差分 隐私 的 机 制 查询 的 情况 
下 ， 上 面 的 说法 才 成 立 。 在 现实 中 ,我 们 可 能 希望 利用 多 种 不 同 的 (e, 0) - 差分 隐 
私 机 制 来 对 数据 库 进 行 多 次 查询 。 

差分 隐私 的 另 一 个 基本 性 质 就 是 差分 隐私 的 损失 是 累加 的 。 也 就 是 说 ， 如 果 
我 们 先 利用 一 个 (e, 0) - 差分 隐私 的 机 制 查询 ， 然 后 再 利用 另 一 个 (s,, 02) - 差分 隐 
私 的 机 制 查询 的 话 ， 那 么 差分 隐私 的 总 损失 至 多 是 (e, +8, +) 

这 个 引 人 注 目的 定理 可 以 用 一 个 有 关 置 信和 度 的 粗略 论证 来 理解 和 。 在 执行 第 
一 个 机 制 之 后 ， 与 没有 查询 数据 库 的 情况 相 比 ， 数 据 库 中 某 个 个 体 的 置信 度 至 多 
变 成 之 前 的 @S 倍 的 概率 至 少 是 1-5。 在 执行 第 二 个 机 制 之 后 ， 该 个 体 的 置信 度 至 
多 变 成 之 前 的 ese2 倍 的 概率 至 少 是 (1-6)(L-6)。 然 而 ， 简 单 的 代数 计算 告诉 我 
iJ, (1-9). 78) Z 1- (0,9), MA e^e? 2 e^*^ 。 将 这 些 信息 组 合 起 来 ， 我 们 可 
以 推出 ， 在 相继 应 用 这 两 个 机 制 之 后 ， 置 信和 度 至 多 变 成 之 前 的 e*'* 倍 的 概率 至 少 
是 1-(61+6,)。 这 正好 相当 于 说 根据 这 两 个 机 制 依次 查询 至 少 是 Ce, res, 61+65,)- 差 
分 隐私 的 。 不 同 机 制 的 相继 执行 会 导致 差分 隐私 损失 的 累加 ! 

这 个 好 消息 也 揭示 了 隐私 的 一 个 重要 难点 。 我 们 对 数据 库 进行 的 查询 越 多 ， 
对 其 中 数据 隐私 的 侵犯 就 越 严 重 。 实 际 上 ， 在 设计 保护 隐私 的 系统 时 ， 相 当 重 要 
的 一 点 就 是 控制 其 整个 生命 周期 ， 并 且 预 备 在 差分 隐私 性 达到 临界 值 时 将 它 彻底 
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删除 。 提 前 预计 隐私 系统 的 生命 周期 也 有 助 于 优化 对 数据 查询 的 回应 。 这 是 因为 
在 提取 的 有 用 数据 量 相同 的 情况 下 ， 不 考虑 未 来 的 查询 而 逐个 啊 应 查询 的 隐私 系 
统 ， 其 差分 隐私 性 要 低 于 对 所 有 问题 的 回应 统一 进行 优化 的 系统 的 差分 隐私 性 。 

一 种 情况 就 是 所 谓 的 在 线 查 询 〈 或 者 实时 查询 )， 第 二 种 情况 就 是 所 谓 的 离 
线 查询 。 某 些 应 用 可 以 直接 处 理 离 线 查询 ， 在 得 到 对 这 些 离线 查询 的 回应 后 就 将 
数据 库 删 除 。 然 而 在 实践 中 ， 隐 私 系统 的 设计 者 通常 受到 只 能 考虑 在 线 查 询 的 限 
制 ， 因 为 在 设计 隐私 系统 的 时 候 ， 人 们 一 般 不 知道 它 将 会 接受 什么 查询 。 特 别 是 
当 这 些 查 询 来 自用 户 而 不 是 系统 设计 者 时 ， 一 般 都 属于 这 种 情况 。 

你 也 想象 得 到 ， 关 于 差分 隐私 还 有 很 多 需要 讨论 的 问题 。 这 个 概念 在 2006 年 
才 被 发 明 出 来 ， 至 今 这 个 领域 的 研究 依然 火热 。 






































在 实践 中 可 行 不 通 








但 是 ， 理 论 思想 和 实际 应 用 之 间 有 着 各 种 复杂 的 障碍 ， 医 院 及 其 他 机 构 中 的 
数据 库 很 可 能 仍 需 要 一 段 时 间 才 会 更 换 成 差分 隐私 的 。 尽 管 有 些 人 已 经 开始 行动 
外 这 种 系统 的 设计 者 和 用 户 尤 其 需要 更 好 地 理解 一 般 意 义 上 的 隐私 ， 以 及 常 
用 的 假名 化 技术 的 局 限 性 。 
话 昌 如此， 现在 我 们 还 不 清楚 差分 隐私 是 不 是 保障 数据 隐私 最 理想 的 概念 。 
差分 隐私 在 某 些 情况 下 可 能 过 于 局 限 ， 特 别 是 因为 无 论 数据 库 中 有 什么 数据 ， 无 
论 尝试 破坏 数据 库 私密 性 的 黑客 拥有 怎样 的 先 验 置信 和 度 ， 差 分 隐私 都 必须 保障 隐 
私 的 安全 。 这 样 的 要 求 太 高 了 ! 此 外 ,还 要 考虑 到 你 一 生 中 失去 的 隐私 就 是 你 在 
所 有 参加 过 的 隐私 机 制 中 失去 隐私 的 总 和 。 

一 种 更 激进 的 隐私 保障 方法 就 是 禁止 信息 的 聚合 ， 让 每 个 人 成 为 自己 信息 的 
唯一 保管 者 。 二 三 十 年 前 ， 在 互联 网 还 没有 来 到 我 们 身边 之 前 ， 这 也 许 还 是 可 以 
想象 的 ， 因 为 每 个 人 的 数据 都 与 其 他 人 的 数据 保持 着 物理 上 的 距离 。 当 时 每 个 人 
都 有 自己 的 计算 机 (或 者 软盘 )， 而 我 们 的 数字 信息 在 物理 上 都 被 限制 在 居所 之 
(虽然 还 有 在 公共 机 构 中 数据 被 打印 并 保存 的 问题 …… )。 

然而 在 今天 ， 我 们 的 私人 数据 在 全 球 互 联网 的 服务 需 之 间 漂 流 ， 甚 至 没有 人 























































































































知道 自己 个 人 资料 的 地 理 位 置 。 更 糟糕 的 是 ， 很 多 这 样 的 数据 都 必定 储存 在 谷歌 、 
MER, Facebook 和 亚马逊 等 互联 网 巨头 的 那些 庞大 的 数据 中 心里 。 无 论 是 你 的 
Facebook 个 人 档案 、 机 票 预订 还 是 度假 照片 修 图 ， 大 部 分 对 这 些 数据 的 处 理 现在 
也 是 在 数据 中 心里 完成 的 。Facebook 甚至 可 以 预测 下 一 个 你 很 喜欢 但 你 的 配偶 不 
喜欢 的 文章 或 者 视频 。 






































同 态 加 密 


然而 希望 还 在 。 所 谓 的 同 态 加 密 可 能 很 快 就 能 颠覆 我 们 与 数据 以 及 数据 中 心 
的 关系 。 这 种 加 密 法 的 原则 就 是 将 私有 数据 的 处 理 交 给 数据 中 心 ， 但 同时 保证 数 
据 中 心 无 法 读 取 或 者 理解 它们 正在 处 理 的 数据 。 

同 态 加 密 已 经 被 用 于 电子 投票 的 数据 安全 与 隐私 保障 ， 网 上 也 有 相关 的 原型 
产品 ， 比 如 Helios 和 Belenios。 它 们 的 大 体 机 制 如 下 。 每 位 投票 者 都 拥有 一 个 私 
钥 ， 可 以 用 于 加 密 投票 并 对 其 签名 ,但 别人 无 法 解密 。 这 些 加 密 后 的 选票 之 后 会 
通过 一 组 可 以 公开 验证 的 运算 组 合 起 来 ， 得 出 被 加 密 的 最 终结 果 。 然 后 ， 投 票 者 
的 私 钥 会 被 组 合 起 来 ， 构 成 某 种 “超级 密 钥 ”， 用 于 对 最 终结 果 解 密 ， 但 它 只 能 解 
开 最 终结 果 。 这 样 做 的 话 ， 我 们 就 能 在 数学 上 保证 最 终结 果 有 效 ， 同 时 不 会 泄露 
任何 一 位 投票 者 选票 的 隐私 。 

即使 这 些 算法 和 密码 学 上 的 技巧 在 原则 上 已 经 解决 了 电子 选票 的 设计 问题 ， 
电子 投票 也 不 能 完全 保证 传统 隔 间 投票 选举 的 所 有 良好 性 质 。 比 如 说 ， 投 票 者 可 
以 在 隔 间 中 独处 而 不 受 任何 人 监视 。 然 而 ， 如 果 投 票 者 通过 手机 投票 ， 那 他 就 可 
能 被 不 法 分 子 威胁 ， 强 迫 他 投 出 特定 选票 。 更 糟糕 的 是 ， 投 票 人 的 机 器 有 被 病毒 
或 者 黑客 攻击 的 风险 ， 它 们 可 能 会 让 投票 者 认为 自己 投 出 了 某 种 选择 ， 而 实际 上 
病毒 或 者 黑客 会 让 选票 变 为 男 一 种 选择 。 

虽然 如 此 ， 对 我 来 说 ， 问 题 并 不 在 于 加 密 的 电子 投票 是 否 完美 ， 而 是 在 于 它 是 
否 优 于 现在 实施 的 投票 方法 一 一 这 种 方法 包含 众多 缺陷 ， 比 如 非常 耗 时 。 但 我 不 打 
算 在 这 个 问题 上 发 表 长 篇 大 论 ， 因 为 它 也 挫 杂 了 道德 因素 ， 超 出 了 知识 哲学 的 范畴 。 

我 们 回 到 同 态 加 密 。 在 电子 投票 的 情况 下 ， 这 种 加 密 法 可 以 将 加 密 后 的 选票 
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整合 成 最 终结 果 ， 虽 然 这 个 结果 是 加 密 的 ， 但 同样 完美 反映 了 所 有 选票 。 这 就 是 
同 态 加 密 的 全 部 魔力 : 计算 机 对 数据 进行 了 处 理 ， 得 出 了 完全 正确 的 答案 ,但 它 
无 法 得 知 这 些 数据 到 底 是 什么 ! 

从 数学 的 角度 来 看 ， 电 子 投票 中 用 到 的 是 相对 简单 的 同 态 加 密 ， 只 需要 将 赞 
成 和 反对 票 加 起 来 ， 这 只 用 到 了 加 法 。 然 而 ， 现 代 同 态 加 密 研 究 的 “圣杯 ”是 实 
现 比 加 法 复杂 得 多 的 运算 。 实 际 上 ， 理 想 情况 是 让 计算 机 能 够 在 加 密 数 据 上 运行 
任意 算法 ， 却 无 法 对 其 解密 。 这 样 的 话 ， 利 用 手机 或 者 计算 机 ， 你 足 不 出 户 就 能 
对 地 球 另 一 端的 数据 中 心 发 出 请 求 ， 让 它 处 理 你 的 加 密 数 据 ， 从 这 些 数据 中 计算 
出 结果 ， 然 后 仅仅 返回 这 一 结果 。 接 下 来 ， 你 用 包含 密 钥 的 手机 将 数据 解密 。 这 
样 的 话 ， 你 就 可 以 随意 阅读 电子 邮件 、 查 看 度假 时 拍 的 照片 ， 或 者 聆听 音乐 ， 而 
数据 中 心 甚至 任何 人 都 不 会 知道 你 下 载 的 是 什么 数据 ! 

实际 上 这 样 的 同 态 加 密 已 经 出 现 了 ,但 可 惜 的 是 ， 它 的 效率 还 太 低 。 要 进行 

所 需 的 操作 ， 数 据 中 心 必须 跳出 各 种 繁杂 、 多 端的 舞步 。 利 用 目前 的 同 态 加 密 算 
法 ， 这 些 数据 中 心 如 果 要 对 加 密 数据 进行 相同 的 操作 ， 就 需要 花费 远 超 现时 不 加 
密 处 理 所 需 的 时 间 、 储 存 空 间 和 电力 。 但 是 毕 竞 研究 进步 神速 …… 






























































赌局 就 是 交 吹 牛 税 。 

亚 历 克 斯 ， 塔 巴 罗 克 〈(1966 一 ) 
什么 样 的 博弈 就 决定 了 参加 者 什么 样 的 行为 。 
我 们 今天 面 对 的 问题 并 不 单纯 是 人 们 失去 了 
信心 ， 还 有 身 处 的 环境 对 信心 演进 的 阻碍 。 
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巴黎 综合 理工 学 院 是 法 国 最 负 盛 名 的 工程 及 科学 大 学 校 ( grande école) 之 一 ， 
建立 于 1794 年 ,在 1804 年 被 拿破仑 一 世 转 为 军校 ， 因 为 他 认为 这 是 招募 军队 指 





挥 官 的 好 地 方 。 今 天 ,巴黎 综合 理工 学 院 仍 受 法 国 国防 部 管辖 。] 




















E 因 如 此 ， 在 入 


读 巴 黎 综合 理工 学 院 时 ， 所 有 法 国学 生 都 必须 参加 为 期 三 周 的 基础 军事 训练 ， 三 











周 之 后 就 是 决定 分 配 的 时 间 了 。 








每 一 届 学 生 有 400 人 ， 其 中 大 概 有 130 名 会 被 分 配 为 陆军 所 属 ，60 名 海军 所 














警察 局 、 消 防 部 门 和 政府 人 道 主义 组 织 中 。 





的 管理 层 想 了 个 妙计 ， 与 其 随机 分 配 ， 不 如 让 学 生 自 行 决定 分 配 。 因 此 学 生 们 开 
































属 ，60 名 空军 所 属 ，60 名 宪兵 所 属 ， 剩 下 的 90 名 学 生 被 分 配 至 军队 的 其 他 部 门 、 


1 于 招募 的 都 是 未 来 的 工程 师 ， 学 院 














发 了 一 个 叫 作 “心计 ”( magouilleuse ) 的 软件 。 每 位 学 生 将 自己 的 健康 情况 与 分 
配 志愿 输入 软件 中 ， 而 软件 会 将 所 有 数据 混在 一 起 ， 运 行 一 个 不 知道 在 干什么 的 
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算法 ， 然 后 就 决定 了 学 生 的 分 配 。 

研究 类 似 软 件 的 性 质 是 一 个 有 趣 的 课题 ， 多 年 以 来 它 一 直 占 据 着 我 的 脑海 。 
事实 上 ， 这 个 问题 是 如 此 吸引 我 ， 以 致 我 将 它 选 为 毕业 论文 的 主题 。 但 令 人 失望 
的 是 ， 经 过 多 年 研究 之 后 ， 即 使 可 以 说 我 因此 更 好 地 理解 了 “心计 ”这 个 问题 ， 
但 我 的 毕业 论文 仍然 没有 完全 解决 这 个 问题 。 

难点 之 一 很 单纯 ， 就 是 确定 “心计 ”的 目的 。 在 我 遭受 “心计 ”“ 毒 手 ” 的 时 
候 ， 如 果 我 相信 那些 人 的 说 法 的 话 ， 它 的 实现 其 实 就 是 对 二 次 损失 的 最 小 化 。 也 
就 是 说 ， 如 果 某 位 学 生 被 分 配 到 了 第 一 志愿 ， 那 么 “心计 ”就 会 给 出 1 点 罚 分 ， 
如 果 被 分 配 至 第 二 志愿 的 话 就 给 出 4 点 罚 分 ， 第 三 志愿 就 是 9 点 。 一 般 来 说 ， 如 
果 被 分 配 到 第 二 个 志愿 ， 那 么 罚 分 就 是 妈 点。 然后 “心计 ”会 尝试 最 小 化 罚 分 的 
总 和 ， 最 终 得 出 的 选择 相当 随意 且 富 有 争议 性 ， 我 在 毕业 论文 里 也 花 了 大 量 篇 幅 
来 探讨 这 个 问题 上 。 

我 们 先 把 这 个 远 非 显然 的 主要 难点 放 到 一 边 。 我 现在 想 要 强调 一 个 公开 的 秘 
窗 ， 它 是 巴黎 综合 理工 学 院 学 生 之 间 永 恒 的 话题 。 想 得 到 好 分 配 的 话 ， 就 不 能 
露出 真实 的 意愿 ， 手 段 就 是 将 最 想 要 的 志愿 放 在 第 一 位 ， 接 下 来 在 第 二 、 第 三 志 
愿 中 填写 的 则 是 那些 大 有 人 和 气 的 分 配 部 门 ， 比 如 海军 和 宪兵 。 这 样 一 来 ， 因 为 这 
些 部 门 很 受 欢迎 ， 所 以 它们 只 会 分 配给 填 入 第 一 志愿 的 人 。 对 “心计 ”来 说 ， 如 
果 学 生 没有 被 分 配 到 第 一 志愿 ， 那 就 可 能 被 分 配 到 第 四 甚至 第 五 志愿 ， 它 们 的 罚 
分 很 高 。 这 样 做 的 话 ,“ 心 计 ” 就 会 更 青睐 那些 应 用 了 这 个 策略 的 人 ， 而 蒙受 损失 
的 则 是 那些 输入 了 真正 志愿 就 结束 的 人 。“ 心 计 ” 并 不 鼓励 诚实 。 
糟糕 的 是 ， 这 种 令 人 困扰 的 现象 不 止 出 现在 “心计 ”中 。 选 举 前 夕 经 党 出现 
关于 到 底 应 该 随心 投票 还 是 随 理性 投票 的 无 休止 的 争论 。 在 2002 年 法 国 总 统 选 举 
的 前 夕 ， 左派 出现 了 大 量 候选 人 ， 也 得 到 了 大 量 选 票 。 但 左派 的 选票 相当 分 散 ， 
这 对 于 左派 的 主要 候选 人 利 昂 内 尔 . 若 斯 潘 来 说 非常 致命 。 者 斯 潘 在 两 轮 单一 选 
择 投票 中 的 第 一 轮 就 被 淘汰 ， 本 来 应 该 是 希拉 克 和 若 斯 潘 势均力敌 的 第 二 轮 ， 变 
成 了 希拉 克 和 勒 庞 不 卉 回首 的 第 二 轮 。 希 拉克 以 巨大 支持 率 获胜 一 一 但 这 只 是 假 
象 。 数 百 万 没有 给 奉 斯 潘 投 票 的 左翼 法 国人 很 后 悔 没有 投 出 “有 用 ”的 票 。 

“心计 ”或 者 两 轮 单一 选择 投票 这 类 决策 机 制 激发 的 行为 正 是 机 制 设计 理论 专 
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门 研究 的 对 象 。 这 一 理论 的 “圣杯 ”就 是 设 定 不 同 个 体 ( 比如 综合 理工 学 院 的 学 
生 或 者 投票 者 ) 之 间 相 互 作用 的 规则 ， 蓝 励 这 些 个 体 表达 真正 的 偏好 (或 者 更 一 
般 来 说 ， 以 符合 伦理 的 方式 行动 )， 得 出 相对 令 人 满意 的 结果 ( 为 学 生 公平 分 配 志 
愿 或 者 选 出 一 位 能 广泛 代表 人 民意 愿 的 候选 人 )。 我 们 将 会 看 到 ， 贝 叶 斯 哲学 对 这 
个 理论 糊 有 贡献 ， 而 且 也 因此 获得 了 多 个 诺 贝 尔 奖 。 

但 在 讨论 之 前 ， 我 们 先 谈 谈 机 制 设 计 理 论 的 基石 ， 也 就 是 博弈 论 。 为 此 ,我 
们 先 到 英国 一 趟 。 




















平分 还 是 独占 











在 电视 游戏 《 金 球 》( Golden Balls) 的 尾声 中 ， 萨 拉 和 史 蒂 文 在 游戏 的 最 后 
一 个 环节 “平分 还 是 独占 ”( split or steal) 中 争夺 共计 100 150 英镑 的 奖池 。 两 位 
参赛 者 面对面 ， 每 人 手 上 都 有 两 个 球 ， 一 个 写 着 “平分 ”( split )， 另 一 个 写 着 “ 独 
占 ”( steal )。 每 位 参赛 者 都 要 选择 其 中 一 个 球 。 如 果 两 位 选择 的 都 是 “平分 ”"， 那 
么 他 们 就 平分 奖金 。 如 果 其 中 一 位 选择 “平分 ”而 男 一 位 选择 “独占 ”的 话 ， 那 
么 选择 “独占 ”的 参赛 者 就 能 独占 整个 奖池 。 最 后 ， 如 果 两 位 选择 的 都 是 “独占 ” 
的 话 ， 那 么 他 们 就 只 能 两 手 空 空 回 家 了 。 

在 做 出 选择 之 前 ， 两 位 参赛 者 可 以 讨论 大 概 半分 钟 。 于 是 萨 拉 昔 昔 良 求 史 蒂 
文平 分 奖池 ， 眼 中 满 含 泪水 。 史 蒂 文 尝试 安抚 萨 拉 ， 向 她 保证 会 平分 奖池 。 讨 论 
就 这 样 结束 了 。 两 位 参赛 者 各 自 秘 密 进 行 了 选择 。 悬 念 揭晓 的 时 刻 到 了 ， 主 持 人 
请 两 位 参赛 者 亮 出 他 们 的 选择 ,所 有 人 看 了 都 大 吃 一 惊 。 虽 然 史 蒂 文 选择 了 “ 平 
分 "， 但 萨 拉 选 择 的 却 是 “独占 ”， 萨 拉 把 整个 奖池 都 偷 走 了 ! 史 蒂 文 目瞪口呆 ， 
意志 消沉 。 萨 拉 坐 立 不 安 ， 眼 神 四 处 游 移 ， 但 的 确 是 她 赢得 了 100 150 英镑 ! 

正如 我 们 的 日 常生 活 那 样 ， 在 “平分 还 是 独占 ”这 个 游戏 里 ， 不 确定 性 无 处 
不 在 。 我 们 非常 依赖 彼此 之 间 的 决策 ， 而 我 们 的 影响 力 相 当 有 限 。 在 这 样 的 情景 
中 ， 与 其 强迫 他 人 以 某 种 方式 行动 ,更 合理 的 方法 通常 是 预计 他 人 的 行动 ， 然 后 
做 出 适应 性 的 举动 ， 即 使 是 激进 活动 也 有 它 的 作用 。 由 此 而 来 的 概念 上 的 困难 ， 
就 是 其 他 人 的 行动 也 会 取决 于 我 们 的 行动 ， 如 刚才 所 说 ， 我 们 的 行动 同样 取决 于 
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他 人 的 行动 ， 而 这 又 依赖 于 我 们 的 行动 …… 循 环 不 休 。 

1951 年 ， 在 一 篇 只 有 28 页 而 且 只 包含 两 个 引用 的 博士 论文 中 ， 未 来 的 诺 贝尔 
经 济 学 奖 获 得 者 约翰 ， 纳什 为 了 砍 断 这 种 无 限 推理 提出 了 纳什 均衡 的 概念 。 所 谓 
纳什 均衡 ， 指 的 是 博弈 中 的 这 样 一 种 情况 : 每 位 参加 者 对 于 其 他 参加 者 的 对 应 行 
动 都 有 着 最 优 的 应 对 。 这 样 的 话 ， 在 已 知 其 他 所 有 人 的 行动 之 后 ， 每 位 参加 者 都 
有 意愿 坚持 本 来 的 策略 。 这 也 正 是 纳什 均衡 被 称 为 均衡 的 原因 : 一 旦 所 有 参加 者 
都 选 定 了 行动 ， 那 么 我 们 可 以 预期 他 们 会 保持 在 这 个 均衡 状态 上 。 

奇怪 的 是 ,简单 考 虑 一 下 就 会 发 现 ， 萨 拉 和 史 蒂 文 的 策略 组 成 了 纳什 均衡 。 这 是 
因为 ， 如 果 知 道 史 蒂 文 会 选择 “平分 "， 萨 拉 就 乐于 选择 “独占 "， 因 为 这 样 的 话 她 的 
收益 就 会 翻 倍 。 而 对 于 史 带 文 来 说 ， 如 果 他 知道 萨 拉 会 选择 “独占 ”的 话 ， 那 么 从 “ 平 
分 ” 换 成 “独占 ”也 不 会 得 益 ， 因 为 在 这 两 种 情况 下 ， 史 带 文 都 只 能 口袋 空空 地 回 家 。 

这 (几乎 ) 就 是 因 徒 困境 的 情况 。 这 个 困境 是 由 梅里 尔 . 弗 勒 德 和 梅 尔 
DC MERTE 1950 年 构思 出 来 的 ， 然 后 由 艾 伯 特 ' 塔 克 做 出 了 严格 的 叙述 。 在 内 
徒 困境 中 ， 两 名 同谋 者 被 警察 逮捕 ， 和 警察 分 别 审问 他 们 。 如 果 其 中 一 名 同谋 者 被 
同伴 告发 ， 那 么 他 的 刑期 就 会 增加 。 然 而 ， 警 察 对 两 名 同谋 者 分 别 保证 ， 告 发 对 
方 可 以 获得 减刑 ， 无 论 对 方 有 没有 告发 自己 。 这 样 的 话 ， 无 论 对 方 做 出 什么 行动 ， 
每 名 同谋 者 告发 对 方 都 可 以 获得 减刑 。 所 以 ， 相 互 告发 就 是 纳什 均衡 ， 甚 至 是 唯 
一 的 纳什 均衡 。 

但 是 如 果 两 名 同谋 者 相互 告发 的 话 ， 那 么 两 人 都 会 被 判刑 ， 而 如 果 他 们 都 保 
持 沉 默 的 话 就 可 以 避免 这 一 情况 。 这 个 故事 的 教训 就 是 对 个 人 的 激励 并 不 一 定 与 
整个 群体 的 利益 一 致 。 在 “平分 还 是 独占 ”中 ， 霸 占 整个 奖池 基本 上 类 似 于 在 办 
徒 困 境 中 告发 同谋 者 。 在 这 两 种 情况 下 ， 所 实行 的 策略 对 于 个 体 来 说 是 最 优 的 ， 
但 对 整体 来 说 则 是 次 优 的 。 







































































































































































贝 叶 斯 式 游说 


然而 ， 这 些 例 子 当 然 被 过 分 简化 了 ,不 能 真正 代表 史 蒂 文 、 萨 拉 以 及 内 徒 困 
境 中 两 位 同谋 者 的 思考 过 程 。 这 是 因为 除了 经 济 收益 和 刑期 时 间 以 外 ,在 众人 有 眼 
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前 背叛 别人 也 有 着 巨大 的 心理 代价 。 比 如 说 ， 不 难 想象 史 蒂 文 会 更 希望 

分 ”而 不 是 “独占 "”。 赢 取 全 部 奖金 但 要 忍受 另 一 位 参赛 者 、 观 众 以 及 家 人 吕 夷 的 
目光 ， 这 可 能 是 难以 忍受 的 重负 。 因 此 ， 无 论 萨 拉 的 选择 是 什么 ， 选 择 “ 平 分 ” 
可 能 对 史 蒂 文 来 说 就 是 最 优 策 略 。 

如 果 史 蒂 文 在 知道 萨 拉 会 选择 “独占 ”的 时 候 ， 更 希望 看 到 萨 拉 丢 掉 所 有 奖 
金 的 话 ， 那 么 事情 就 变 得 有 趣 起 来 了 。 也 就 是 说 ， 现 在 想象 一 下 史 蒂 文 希望 看 到 
的 结果 排序 如 下 : 平分 /平分 、 独 占 / 独 占 、 独 占 / 平 分、 平分 /独占 ， 每 一 对 中 
的 第 一 个 是 史 蒂 文 的 选择 ， 第 二 个 是 萨 拉 的 选择 。 这 样 的 话 ， 史 带 文 的 最 优 策略 
就 依赖 于 了 桩 拉 的 选择 。 如 果 萨 拉 选 择 了 “平分 ”"， 那 么 史 带 文 会 更 倾向 于 选择 “ 平 
分 ”; 但 如 果 萨 拉 选 择 的 是 “独占 ”， 那 么 史 蒂 文 也 会 希望 选择 “独占 ”。 

史 蒂 文 和 萨 拉 在 事前 的 讨论 (还 有 贝 叶 斯 哲学 ) 就 在 这 里 扮演 了 重要 角色 。 
这 样 的 讨论 可 以 影响 史 蒂 文 关于 萨 拉 会 做 出 的 不 同 选择 的 置信 度 。 显 然 在 我 们 考 
虑 的 情况 中 ， 萨 拉 成 功 说服 了 史 蒂 文 她 会 选择 “平分 ”。 她 做 得 很 成 功 ， 史 蒂 文 很 
快 就 相信 她 的 确 会 这 样 做 ， 甚 至 忘记 了 另 一 种 可 能 的 行动 ， 因 此 他 后 来 如 此 失望 。 

此 外 ,沟通 本 身 也 可 以 用 贝 叶 斯 的 方式 来 准确 描述 ， 毕 竞 沟通 就 相当 于 揭示 
一 项 信息 ， 对 方 可 以 据 此 更 新 置信 和 度 。 为 此 ， 经 济 学 家 埃 米尔 ' 卡 梅 尼 察 和 马 
修 ' 根 奖 科 在 2011 年 考虑 了 检察 官 如 何 才 能 在 信奉 贝 叶 斯 主义 的 法 官 面前 尽 可 能 
对 嫌疑 人 定罪 。 惊 人 的 是 ， 他 们 证 明了 一 名 优秀 的 检察 官 可 以 说 服 法 官 定罪 的 人 
数 要 高 于 法 官 认为 有 罪 的 人 数 ! 
具体 情况 是 怎么 样 的 呢 ? 法 官 作为 一 名 合格 的 贝 叶 斯 主义 者 ， 必 定 对 嫌疑 人 
是 否 有 罪 有 着 自己 的 偏见 。 假 设 这 个 偏见 是 PP 加 =0.3。 此 外 ， 我 们 假设 只 有 在 对 
于 嫌疑 人 有 罪 的 置信 和 度 大 于 等 于 无 罪 的 置信 和 度 时 ， 这 位 贝 叶 斯 主义 的 法 官 才 会 将 
其 判 为 有 罪 。 为 了 说 服 这 位 法 官 ， 检 察 官 会 要 求 进行 某 项 有 些 特殊 的 调查 。 如 果 
嫌疑 人 有 罪 的 话 ， 调 查 能 够 证 明 他 有 罪 ; 但 如 果 嫌 疑 人 无 罪 的 话 ， 调 查 有 可 能 出 
错 ，7 次 中 有 3 次 会 显示 嫌疑 从 有罪 ， 即 使 嫌疑 人 实际 上 是 无 罪 的 。 检 察 官 知 道 这 
一 点 ， 而 法 官 也 知道 这 一 点 。 

当然 ， 这 样 的 话 ， 如 果 调 查 显示 嫌疑 人 有 罪 ,可 能 只 是 因为 调查 出 错 了 。 然 
而 ， 这 只 会 让 法 官 更 加 怀疑 嫌疑 人 有 罪 。 贝 叶 斯 计算 可 以 准确 得 出 这 项 后 验 置 信 
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度 的 怀疑 程度 : 
Ud uy) 
"" - -05 
Pe? = sapi + PPS PS] 1x03+3x07 
7 














换 名 话说， 作为 贝 叶 斯 主义 者 的 法 官 一 旦 知道 调查 显示 嫌疑 人 有 罪 ， 那 么 法 官 认 
为 他 有 罪 的 后 验 置信 度 就 相当 于 认为 他 无 罪 的 后 验 置信 和 庶 ， 于 是 就 会 判 他 有 罪 "。 
这 样 的 话 ， 所 有 在 调查 中 显示 有 罪 的 嫌疑 人 都 会 被 定罪 。 但 是 调查 显示 有 罪 的 概 
率 可 以 通过 全 概率 公式 计算 出 来 : 




















[9] = PPSP + P9 o |P[ 6] =1x0.3+ x0.7=0.6 


也 就 是 说 ,法官 有 60% 的 概率 将 嫌疑 人 定罪 , 虽然 他 对 嫌疑 人 有 罪 的 先 验 置 信和 度 
只 有 30%。 法 官 必然 给 太 多 嫌疑 人 定 了 罪 ! 

但 要 摘 清 楚 的 是 ， 这 并 不 一 定 是 法 官 遵循 贝 叶 斯 主义 的 缺陷。 如 果 他 没有 利 
用 贝 叶 斯 公式 ， 而 是 仅仅 依靠 先 验 置信 度 的 话 ， 法 官 就 会 判定 所 有 嫌疑 人 无 罪 ， 
跟 之 前 的 错误 率 相同 。 法 官 的 目的 不 是 使 定罪 的 人 数 与 有 罪 的 人 数 相同 ， 而 是 使 
错误 率 尽 量 小 ”。 

这 样 的 话 ， 有 没有 可 能 欺骗 某 位 贝 叶 斯 主义 者 的 法 官 ， 使 他 的 错误 率 提 高 ? 
答案 是 否定 的 。 这 是 因为 贝 叶 斯 推断 拥有 一 项 惊人 的 性 质 ， 让 它 可 以 与 其 他 形式 
的 归纳 法 区 分 开 来 : 只 要 法 官 正确 地 解释 所 有 额外 信息 ， 并 且 应 用 贝 叶 斯 公式 的 
话 ， 正 确 率 的 期 望 值 就 不 可 能 减少 ”。 也 就 是 说 ， 计 算数 学 期 望 的 话 ， 贝 叶 斯 主义 
者 总 会 得 益 于 额外 的 信息 。 























































































































(D 将 3/7 换 成 3/7-e 的 话 ， 我 们 可 以 得 到 基本 上 相同 的 结果 。 
© 也 要 注意 到 ， 在 这 里 考虑 的 情况 中 ， 将 无 束 的 人 定罪 和 宣告 有 罪 的 人 无 罪 的 代价 对 于 法 官 来 
说 是 相同 的 。 要 处 理 关 于 在 不 确定 性 下 进行 公平 判决 的 种 种 道德 哲学 ， 只 需要 对 问题 进行 简 
单 修改 即 可 。 
更 一 般 地 说 ， 考 虑 某 位 贝 叶 斯 主义 者 ， 他 的 效用 函数 符合 冯 “' 诺 伊 曼 和 葛根 施 特 恩 的 公理 。 他 
需要 在 不 知道 某 个 变量 x 的 情况 下 做 出 某 个 决策 a。 如 果 没 有 额外 的 信息 y 的话， 这 位 贝 叶 
斯 主义 者 会 选择 sup, Edula, x)]。 假 设 现在 他 知道 了 y， 那 么 他 会 尝试 最 大 化 sup,E[u(a, x)by]。 
其 收益 的 先 验 期 望 值 就 是 IE, [sup Edula, be RE Pixy] 是 通过 贝 叶 斯 公式 计算 得 来 的 ， 那 
么 贝 叶 斯 主义 者 就 知道 了 yy 会 有 所 得 益 ， 也 就 是 E [sup E Lula, x)lv]] > sup,E lula, x)]。 
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谢 林 点 





我 们 回 到 “平分 还 是 独占 ”。 如 果 我 们 现在 想象 陕 拉 的 偏好 与 史 带 文 相同 的 
话 ， 这 个 游戏 就 会 变 得 更 加 有 趣 。 在 这 种 情况 下 ， 两 个 人 都 希望 平分 奖池 。 实 际 
上 他 们 只 需要 说 服 对 方 自己 会 选择 平分 ， 那 就 会 一 切 顺 利 。 

然而 ， 即 使 是 最 细微 的 怀疑 也 会 摧毁 这 一 切 。 如 果 史 蒂 文 不 慎 说 错 了 话 ， 给 
对 方 一 种 他 可 能 不 会 选择 “平分 ”的 印象 的 话 ， 那 么 蔷 拉 可 能 会 提高 她 对 史 蒂 文 
选择 “独占 ”的 置信 度 。 这 个 置信 和 度 可 能 会 变 得 很 大 ， 到 了 某 个 地 步 ， 萨 拉 可 能 
会 更 倾向 于 选择 “独占 ”而 不 是 “平分 "， 因 为 她 害怕 遭受 被 史 带 文 抢 去 腿 前 奖金 
的 届 辱 。 但 如 果 萨 拉 将 这 种 犹豫 流露 出 来 的 话 ， 史 带 文 也 可 能 预计 她 会 选择 “ 独 
占 "， 因 此 他 也 会 选择 “独占 ”来 对 抗 。 

这 就 是 所 谓 的 协调 问题 ， 在 这 里 ， 我 们 有 两 个 对 称 的 纳什 均衡 ”: 其 中 一 个 均 
衡 是 萨 拉 和 史 蒂 文 都 选择 了 “平分 "， 氏 大 欢喜 ; 男 一 个 均衡 则 是 两 个 人 都 选择 了 
“独占 ”， 扫 兴 而 归 。 但 如 果 两 人 不 协调 的 话 ， 结 果 对 两 个 人 来 说 都 会 更 糟糕 ， 要 
么 是 因为 看 到 男 一 位 参加 者 抢 去 了 奖金 ， 要 么 是 因为 观众 会 向 自己 投 来 鄙夷 的 眼 
光 。 也 就 是 说 ， 游 戏 的 结果 是 由 他 们 各 自 会 对 对 方 做 什么 的 置信 度 决 定 的 一 一 错 
误 的 置信 和 度 可 能 会 给 双方 带 来 灾难 ! 

当然 ， 这 类 协调 问题 远 远 超出 了 “平分 还 是 独占 ”的 范畴 。 在 某 些 电影 的 桥 
段 中 ， 两 人 暗 生 情 剑 ， 却 不 敢 向 对 方 表 露 爱 火 ， 只 因 怀 疑 对 方 对 自己 是 否 有 兴趣 。 
错误 的 置信 度 可 能 会 断送 这 一 段 美丽 的 爱情 故事 ， 而 整 部 电影 的 看 点 往往 就 是 双 
方 如 何在 离奇 的 状况 下 学 习 到 了 正确 的 置信 和 度 ! 

我 们 的 传统 、 协 议和 规程 就 是 为 了 解决 这 些 协调 问题 而 存在 的 。 这 些 构 筑 社 
会 关系 的 元 素 就 是 所 谓 的 谢 林 点 ， 这 个 名 字 来 源 于 2005 年 诺 贝 尔 经 济 学 奖 获得 者 
托马斯 . 谢 林 。 用 贝 叶 斯 主义 的 语言 来 说 ， 这 些 谢 林 点 可 以 用 于 对 社会 中 其 他 人 
的 行为 建立 先 验 置信 和 度 。 

做 出 理性 的 证 明 似乎 经 常 需要 对 这 些 谢 林 点 的 良好 预测 ， 它 们 也 因此 在 个 体 
行动 中 发 挥 了 重要 的 作用 。 所 以 我 们 可 以 想象 ， 如 果 信 任 和 诚实 在 身 处 的 社会 中 









































































































































中 ”实际 上 还 有 第 三 个 纳什 均衡 ， 就 是 萨 拉 和 史 蒂 文 都 随机 选择 “平分 ”或 者 “独占 ”。 
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是 稳妥 的 谢 林 点 的 话 ， 史 蒂 文 和 萨 拉 最 后 一 定 会 选择 “平分 "。 反 过 来 说 ， 如 果 社 
会 的 规范 不 是 相互 信任 ， 怀 疑 才 更 为 明智 的 话 ， 史 蒂 文 和 萨 拉 可 能 就 更 倾向 于 选 
择 “ 独 占 ”。 











“平分 还 是 独占 ”还 有 最 后 一 个 变种 ， 可 以 让 我 们 探索 到 个 体 互动 的 其 他 微妙 
之 处 。 现 在 假设 史 带 文 和 萨 拉 都 很 想 要 这 笔 钱 ， 并 且 他 们 保证 如 果 某 个 人 赢得 了 
整 份 奖金 ， 就 会 给 对 方 1 万 英镑 作为 补偿 。 这 样 的 话 ， 他 们 现在 的 偏好 就 是 ， Th 
占 /平分 ， 获 利 9 万 英镑 ; 平分 /平分 ， 获 利 5 万 英镑 ; 平分 /独占 ， 获 利 1 万 英 
镑 ; 独占 /独占 ， 获 利 为 0。 

奇怪 的 是 ， 如 果 萨 拉 宣称 她 要 选择 “独占 "， 那 么 史 蒂 文 就 完全 有 意愿 选 # 
“平分 ”， 这 会 让 萨 拉 对 自己 的 选择 更 放心 。 反 过 来 说 ， 如 果 史 带 文宣 布 要 选择 
“独占 ”， 两 人 的 角色 就 倒 过 来 了 。 因 此 ， 这 个 博弈 拥有 两 个 反对 称 的 纳什 均衡 ， 
它 产 生 了 一 个 发 人 深思 的 难题 : 每 位 参与 者 都 希望 说 服 对方 接 受 对 自己 有 利 的 那 
个 纳什 均衡 。 在 现实 中 ， 这 会 让 每 位 参赛 者 都 宣称 希望 拿 到 整 份 奖金 ， 而 且 尝试 
比 对 方 显得 更 有 说 服 力 。 

这 种 策略 看 上 去 可 能 很 荒诞 。 然 而 ， 当 尼克 和 亚伯拉罕 在 “平分 还 是 独占 ” 
中 面对面 争夺 一 共 1.3 万 英镑 的 奖金 时 ， 令 人 震惊 但 无 比 有 效 的 策略 出 现 了 。 尼 克 
突然 说 :亚伯拉罕 ， 和 希望 你 相信 我 ， 我 100% 会 选择 “独占 "-。” 人 惊慌 失措 的 亚 伯 
拉 军 似乎 觉得 自己 无 能 为 力 ， 上 暗自 思 付 :“ 你 的 脑子 怎么 想 的 ?” 然 后 又 想 道 : “你 
EPAR” 

但 尼克 不 是 和 白痢， 他 只 是 想 保证 亚伯拉罕 有 全 部 的 动力 去 选择 “平分 ”一 一 
因为 尼克 并 不 想 搞 阴谋 诡计 ， 他 自己 也 选择 了 “平分 ”! RSA HEO RAE, 
亚伯拉罕 在 电 合 市 目 Radio Labh 的 采访 中 承认 了 他 一 开始 的 确 是 想 选 择 “ 独 占 ” 
的 。 尼克 的 策略 可 谓 完美 。 

现在 想象 一 下 ， 受 尼克 的 启发 ， 史 带 文 和 萨 拉 两 人 都 选择 模仿 他 的 策略 。 然 
而 ,他 们 两 人 在 事前 的 讨论 中 都 没有 被 说 服 。 于 是 他 们 面临 的 就 是 一 个 本 质 上 非 
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常 贝 叶 斯 的 问题 。 两 个 人 都 不 确定 对 方 会 怎么 做 ， 于 是 就 必须 以 先 验 置信 和 度 为 基 
础 进行 概率 推断 。 

比如 说 ， 假 设 史 蒂 文 认为 萨 拉 选 择 “ 平 分 ”和 “独占 ”的 概率 是 一 半 一 半 ， 
如 果 他 选择 “独占 ”的 话 ， 就 有 1/2 的 概率 会 得 到 “独占 /平分 ”的 收益 ， 也 就 是 
9 万 英镑 ， 而 另 1/2 的 概率 则 是 得 到 “独占 /独占 ”的 收益 ， 也 就 是 0 SRE, EAG 
文 的 期 望 收益 就 是 4.5 万 英镑 。 

反之 ， 如 果 史 蒂 文 选择 “平分 "， 那 么 他 有 1/2 的 概率 获得 “平分 /平分 ”的 
收益 ， 也 就 是 5 万 英镑 ， 而 有 1/2 的 概率 会 获得 “平分 /独占 ”的 收益 ， 也 就 是 1 
万 英镑 。 他 的 期 望 收 益 就 是 3 万 英镑 。 史 带 文 的 计算 驱使 他 选择 “独占 ”而 不 是 
“平分 ”， 因 为 “独占 ”的 期 望 收益 更 高 S 

因为 这 本 书 讨论 的 是 贝 叶 斯 理论 中 的 主观 概率 ， 我 需要 强调 这 里 涉及 的 关于 
史 带 文 和 萨 拉 的 概率 绝对 不 是 频率 主义 中 的 那 种 概率 。 尽 管 我 在 这 里 出 于 简明 易 
懂 的 需要 采用 了 频率 主义 的 语言 ， 但 史 带 文 和 萨 拉 并 非 每 天 都 在 参加 “平分 还 是 
独占 ”。 此 外 ， 潜 在 收益 代表 的 是 他 们 各 自生 活 中 一 个 孤立 而 独特 的 情况 ， 但 我 们 
讨论 的 并 不 是 这 个 游戏 的 平均 收益 。 在 这 里 ， 期 望 收益 ， 或 者 说 收益 的 期 望 ， 对 
应 的 是 他 们 各 自 根据 主观 概率 预测 的 收益 。 

回 到 史 蒂 文 和 萨 拉 的 情况 。 现 在 我 们 假设 这 两 个 人 都 非常 聪明 ， 他 们 也 知道 
对 方 同样 聪明 。 因 为 在 事前 讨论 中 ， 史 蒂 文 和 萨 拉 都 明确 给 出 了 会 选择 “独占 ” 
的 印象 ， 所 以 他 们 就 碰壁 了 。 为 了 走出 绝路 ， 史 带 文 突然 确认 他 会 以 415 的 概率 选 
择 “ 独 占 ”， 否 则 就 选择 “平分 ”"， 然 后 他 建议 萨 拉 也 这 样 做 。 

于 是 萨 拉 就 开始 进行 期 望 的 计算 。 假 设 史 蒂 文 言 出 必 行 ， 如 果 萨 拉 选 择 “ 独 
占 ” 的 话 ， 那 么 她 就 有 4/5 的 概率 会 获得 0 英镑 ， 有 1/5 的 概率 获得 9 万 英镑 ， 得 
出 的 期 望 收益 就 是 1.8 万 英镑 ”。 反 过 来 ， 如 果 萨 拉 选 择 “ 平 分 ”的 话 ， 那 么 她 就 有 
AIS 的 概率 会 获得 1 万 英镑 ，1/5 的 概率 获得 5 万 英镑 ， 期 望 收益 也 是 1.8 万 英镑 “。 






































































































































© 我 们 在 这 里 假设 所 有 参加 者 都 希望 得 到 金钱 ， 并 上 且 厌 恶 风 险 ， 也 就 是 说 获得 数量 为 x 的 金钱 
时 ， 效 用 u(x) 的 值 为 u(x)=x。 

@ 这 一 步 的 算式 是 4/5x0+1/5x9=1.8。 

@ 这 一 步 的 算式 是 4/5x1+1/5x5=1.8。 
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于 是 她 得 出 结论 ， 她 的 选择 并 不 影响 期 望 收益 。 此 外 ， 她 也 意识 到 ， 如 果 听 从 史 
带 文 的 建议 ， 那 么 她 也 能 激励 史 蒂 文 坚持 他 的 策略 。 萨 拉 不 仅 接受 了 这 项 建议 ， 
甚至 保证 她 也 会 以 4/5 的 概率 选择 “独占 ”。 用 术语 来 说 ， 这 就 是 所 谓 的 混合 纳什 
均衡 ， 也 就 是 说 ,参与 者 的 策略 是 随机 的 。 

如 果 史 蒂 文 和 萨 拉 都 最 大 化 各 自 的 收益 并 拒绝 不 平等 的 话 ， 纳 什 的 理论 保证 他 
们 会 采取 的 策略 正 是 这 一 混合 均衡 "。 然 而 ,这 一 纳什 均衡 与 大 部 分 纳什 均衡 一 样 ， 
不 是 最 优 的 ， 因 为 如 果 史 蒂 文 和 萨 拉 都 选择 “平分 ”的 话 就 能 获得 更 好 的 收益 。 

后 来 的 诺 贝尔 经 济 学 奖 获得 者 罗伯特 . 奥 曼 就 对 此 做 出 了 贡献 。1974 年 ， 奥 
曼 提出 可 以 引入 所 谓 的 信号 ， 也 就 是 某 种 “ 红 灯 ”， 用 以 协调 参加 者 的 决策 。 

比如 说 ， 这 种 信号 可 以 是 一 枚 硬币 的 正 反面 。 如 果 硬 币 掷 出 正面 ， 那 么 史 蒂 
文 就 选择 “独占 ”， 而 萨 拉 选 择 “平分 ”; 如 果 硬 币 反面 向 上 ， 那 就 反 过 来 。 这 种 
外 部 信号 的 绝妙 之 处 就 在 于 ,一 旦 得 到 了 硬币 的 结果 ， 史 蒂 文 和 萨 拉 就 完全 有 动 
机 听从 硬币 的 安排 。 也 就 是 说 ,已 知 信号 和 对 方 根据 信号 会 做 出 的 行为 ， 史 带 文 
和 萨 拉 的 最 优 策略 就 是 采取 信和 号 提示 的 行动 。 于 是 这 几乎 是 一 个 纳什 均衡 。 这 又 
被 称 为 相关 均衡 。 所 有 纳什 均衡 都 可 以 表示 为 没有 信号 的 相关 均衡 。 

然而 添加 信号 可 以 大 幅 改 善 纳 什 均衡 。 在 史 带 文 和 萨 拉 的 情况 中 ， 在 看 到 信 
号 之 后 ， 预 期 收益 变 成 了 5 万 英镑 。 换 句 话说， 信号 让 他 们 可 以 做 得 跟 每 个 人 都 
没有 意愿 偏离 “平分 /平分 ”的 情况 一 样 好 |! 














































































































贝 叶 斯 博弈 


博弈 论 与 贝 叶 斯 哲学 的 主观 概率 结合 起 来 就 构成 了 一 座 威 力 巨 大 的 军火 库 ， 
可 以 用 来 进攻 那些 具有 不 确定 性 的 复杂 决策 问题 。 扑 克 就 是 这 样 的 例子 。 在 一 局 
扑克 的 开头 ， 每 位 玩家 都 知道 自己 的 手 牌 ,但 不 知道 其 他 玩家 的 手 牌 。 然 而 当 游 
戏 逐 步 展开 时 ， 某 些 玩 家 会 放弃 说 钱 的 机 会 (又 叫 “ 盖 牌 ” )， 而 其 他 玩家 则 会 额 


























中 ”纳什 证 明了 所 有 对 称 博弈 都 有 一 个 〈 可 能 是 混合 的 ) 对 称 均衡 。 
D 不 难看 到 纳什 均衡 的 凸 包 包含 在 相关 均衡 的 集合 里 。 然 而 ， 相 关 均 衡 组 成 的 集合 一 般 比 纳什 
均衡 的 凸 包 要 大 ， 有 时 候 由 此 可 以 得 出 明显 优 于 任何 纳什 均衡 组 合 的 相关 均衡 ! 
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外 下 注 。 

纯粹 贝 叶 斯 主义 者 会 利用 贝 叶 斯 公式 来 调整 自身 对 其 他 玩家 手 牌 的 置信 和 度 。 
比如 次 ， 如 果 对 手 比 平常 更 加 吊 吊 逼 人 ， 下 注 也 更 大 的 话 ， 她 就 会 认为 对 方 手 上 
的 牌 比 较 好 。 当 然 ， 这 并 不 能 证 明 对 方 手 牌 确实 好 ， 但 为 了 做 出 最 优 的 决策 ， 更 
新 置信 度 并 根据 新 的 置信 度 来 调整 策略 是 必 不 可 少 的 。 

这 种 富有 不 确定 性 的 情景 中 的 博弈 论 又 被 称 为 贝 叶 斯 博弈 论 ， 这 真是 个 没 什 
么 独创 性 的 名 字 。 这 个 理论 来 自 约翰 SERRE 1967 年 发 表 的 三 篇 系列 论文 ， 
他 后 来 于 1994 年 与 纳什 一 起 获得 了 诺 贝 尔 经 济 学 奖 。 通 过 添加 其 他 玩家 手 牌 或 偏 
好 的 不 确定 性 ， 豪 尔 绍 尼 让 博弈 论 变 得 更 为 现实 ， 并 使 之 适用 于 更 多 的 实际 问题 ， 
在 这 些 问 题 中 ， 决 策 所 需 的 信息 并 不 完整 。 

肾 尔 绍 尼 也 利用 了 贝 叶 斯 的 语言 来 解释 混合 纳什 均衡 的 重要 性 ， 以 此 解释 了 
个 人 策略 的 不 确定 性 如 何 来 自 偏 好 的 不 确定 性 。 这 也 提示 了 豪 尔 绍 尼 纯 化 定理 的 
存在 。 而 更 为 关键 的 是 ， 豪 尔 绍 尼 最 终 将 贝 叶 斯 哲学 放 到 了 经 济 思考 的 中 心 。 后 
来 于 2007 年 获得 诺 贝 尔 经 济 学 奖 的 罗 杰 “' 迈 尔 森 ， 曾 在 2004 年 这 样 断言 : “现代 
信息 经 济 学 的 统一 性 与 应 用 范畴 都 来 自豪 尔 绍 尼 的 框架 。 

在 贝 叶 斯 的 语 境 下 ， 纳 什 均衡 的 等 价 物 被 称 为 贝 叶 斯 -纳什 均衡 。 在 这 个 情 
况 中 ， 每 位 参与 者 执行 的 策略 都 是 对 于 其 他 人 的 策略 的 最 优 应 对 。 然 而 ， 要 在 由 
叶 斯 的 语 境 中 理解 “策略 ”这 个 概念 ， 还 存在 一 点 微妙 之 处 。 在 这 里 ， 策 略 就 是 
某 种 根据 私密 信息 做 出 的 行动 ， 这 种 私密 信息 可 以 是 个 人 偏好 ， 也 可 以 是 手 牌 。 
比如 说 ， 在 扑克 游戏 的 情况 中 ， 这 样 的 策略 可 能 就 是 如 果 有 一 对 A 的 话 就 加 倍 下 
注 ， 否 则 盖 牌 一 一 这 个 策略 很 可 能 不 是 最 优 的 。 











































































































































































































贝 叶 斯 机 制 设计 * 





我 们 终于 可 以 回 到 对 “心计 ”的 讨论 了 。 竺 看 起 来 ， 与 其 开发 “心计 ”之 类 
的 软件 ， 不 如 尝试 建立 一 个 学 生 之 间 的 协商 机 制 ， 最 终 得 出 总 体 的 分 配 决定 。 抛 
开 这 种 替代 方法 令 人 望而却步 的 复杂 度 不 谈 ， 机 制 设计 理论 给 出 了 一 个 漂亮 的 定 
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理 。 依 靠 贝 叶 斯 的 原则 “”“， 这 个 定理 证 明了 我 们 总 是 可 以 将 情况 化 归 为 相对 简单 的 
情况 ， 其 中 有 一 个 中 央 权 威 (在 这 里 是 “心计 ”软件 ) 会 收集 所 有 学 生 的 偏好 ， 
然后 得 出 总 体 决策 。 这 个 定理 是 显示 原理 的 推论 Pl 

要 理解 这 一 原理 ， 我 们 来 考虑 任意 的 机 制 M， 其 中 每 个 个 体 都 在 自 喘 贝 叶 斯 置 
信 度 的 指引 下 以 最 大 化 效用 期 望 的 方式 行动 。 也 就 是 说 ， 每 个 个 体 的 行动 都 符合 机 
Hl M 的 贝 叶 斯 -纳什 均衡 。 一 旦 机 制 执行 完毕 ， 我 们 就 获得 了 整个 群体 的 决策 x， 
比如 向 军队 不 同 部 门 的 分 配 。 显 示 原 理 让 我 们 可 以 通过 某 种 超级 版 “心计 ”得 到 相 
同 的 整体 决策 x。 这 个 超级 版 “心计 ”会 收集 每 个 个 体 的 偏好 ， 然 后 模拟 每 个 个 体 
在 机 制 MM 中 根据 贝 叶 斯 -纳什 均衡 所 做 的 行动 。 这 样 的 话 ， 它 就 能 计算 所 有 结果 ， 
由 此 推出 群体 的 总 体 决 策 x。 这 就 是 超级 版 “心计 ”决定 为 整个 群体 选择 的 决策 。 

这 种 模拟 的 高 明之 处 就 在 于 ， 在 每 个 个 体 眼 中 ， 他 们 所 做 的 就 是 说 明 自 己 的 
偏好 。 然 后 超级 版 “心计 ”就 会 从 中 推断 出 结果 。 更 妙 的 是 ， 与 单一 选择 投票 和 
巴黎 综合 理工 学 院 使 用 的 “心计 ”不 同 ， 每 个 个 体 都 完全 有 动机 诚实 地 出 示 自 己 
的 偏好 。 这 是 因为 如 果 某 个 个 体 给 出 的 不 是 自己 的 偏好 ， 那么 超级 版 “心计 ”就 
会 根据 这 个 不 属于 他 的 偏好 来 模拟 这 个 个 体 。 该 个 体 在 模拟 中 的 行为 也 就 并 非 对 
他 而 言 最 优 的 ， 这 就 让 他 无 法 出 于 个 人 利益 来 影响 整体 的 决策 。 

所 谓 的 “律师 与 客户 保密 特权 ”依靠 的 正 是 这 个 巧妙 的 方法 。 这 是 因为 我 们 
希望 得 出 对 被 告 的 判决 。 在 理想 情况 下 ， 这 项 判决 需要 考虑 只 有 被 告知 道 的 某 些 
信息 。 然 而 一 般 来 说 ， 被 告 没 有 动机 说 出 他 知道 的 一 切 一 一 特别 是 如 果 他 知道 自 
己 有 罪 的 话 。 于 是 法 庭 建立 了 一 个 可 以 让 原告 和 被 告 进 行 辩论 的 互动 平台 ， 而 最 
终 的 判决 正 是 这 一 互动 平台 的 结果 。“ 律 师 与 客户 保密 特权 ”这 项 原则 其 实 就 是 添 
加 了 可 以 模拟 原告 和 被 告 立 论 的 中 间 人 ， 无 须 原告 和 被 告 的 直接 介入 。 这 些 模拟 
原告 和 被 告 的 中 间 人 就 是 检察 官 和 辩护 律师 。 然 而 ， 为 了 让 律师 能 忠实 地 模拟 原 
告 和 被 告 ， 他 们 必须 知道 客户 所 知道 的 一 切 。 为 此 ， 必 须 使 客户 有 动机 向 律师 展 
示 他 们 所 知道 的 一 切 ， 而 这 正 是 “律师 与 客户 保密 特权 ”尝试 做 出 的 保证 。 

在 博弈 论 中 ， 显 示 原 理 的 主要 应 用 就 是 解释 为 什么 我 们 会 有 兴趣 在 ( 几乎 ) 










































































































































































CD. 显示 原理 也 有 非 贝 叶 斯 的 版 本 。 
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不 失 一 般 性 的 情况 下 ， 建 立 一 个 收集 所 有 人 的 私密 信息 来 做 出 整体 决策 的 中 心 化 
机 制 。 特 别 是， 这 一 原理 让 我 们 能 发 现 某 种 应 用 非常 广泛 的 机 制 ， 可 以 保证 整体 
决策 能 最 大 化 所 谓 的 “社会 福利 ”， 也 就 是 个 体 效 用 的 总 和 ， 同 时 也 鼓励 参加 者 
诚实 作答 。 这 个 引 人 注 目的 方法 又 叫 VCG (Vickrey-Clarke-Groves ) 机 制 ， 它 的 
名 字 来 自 1996 年 诺 贝 尔 经 济 学 奖 获得 者 威廉 ' 维 克 里 、 爱 德 华 . 克拉 克 和 西 奥 
Z gue 内。 

















迈 尔 森 的 拍卖 


在 只 有 一 件 物品 的 拍卖 之 中 ， 社 会 福利 的 最 大 化 意味 着 将 拍卖 的 物品 转让 给 
出 价 最 高 的 人 。VCG 机 制 通过 让 这 个 人 付出 第 二 高 的 出 价 就 能 保证 他 购 得 拍卖 物 
品 。 然 而 这 种 被 称 为 “第 二 价格 拍卖 ”的 方法 似乎 并 不 能 最 大 化 卖家 的 收益 。 对 
于 卖家 来 说 ， 直 接 将 物品 以 最 高 出 价 卖 出 不 是 更 好 吗 ? 

2007 年 诺 贝 尔 经 济 学 奖 得 主 罗 杰 ' 迈 尔 森 给 出 了 惊人 的 否定 回答 。 如 果 物 品 
总 是 会 被 卖 给 出 价 最 高 的 人 ， 那 么 无 论 要 付 的 价格 是 如 何 确 定 的 ， 只 要 竞拍 人 全 
都 像 贝 叶 斯 主义 者 那样 最 大 化 自己 的 期 望 效 用 ， 那 么 卖方 的 期 望 收益 都 会 是 一 样 
的 ! 这 正 是 令 人 震惊 的 迈 尔 森 收益 等 价 定理 "。 

但 迈 尔 森 的 这 个 定理 依赖 于 一 个 小 小 的 技术 细节 ， 由 此 可 以 看 出 实践 中 人 类 
互动 的 复杂 性 。 要 使 迈 尔 森 的 定理 适用 于 这 一 情况 ， 就 必须 假设 竞拍 者 和 卖家 对 
于 每 个 人 为 获得 商品 准备 付出 什么 价格 都 有 着 某 个 共同 的 先 验 置信 度 。 这 是 贝 叶 
斯 博弈 论 中 普遍 采用 的 假设 ， 为 的 是 简化 计算 并 避免 引出 形而上学 的 问题 。 然 而 ， 
这 个 假设 并 不 正确 。“ 所 有 模型 都 是 错 的 ”。 

在 一 般 的 情况 下 ， 实 际 上 存在 着 所 谓 的 “高 阶 信念 ”问题 ， 也 就 是 说 ， 竞 拍 
者 对 另 一 位 竞拍 者 对 于 自身 准备 付出 多 少 价格 的 置信 度 有 某 种 信念 ， 以 及 他 对 认 
为 男 一 位 竞拍 者 认为 他 认为 对 方 偏 好 持 有 某 种 信念 ， 等 等 。 有 趣 的 是 ， 我 们 可 以 
意识 到 纯粹 贝 叶 斯 主义 者 一 直 都 在 考虑 类 似 的 想法 。 然 而 这 些 高 阶 信念 的 研究 极 




























































































































































































(D 与 VCG 机 制 一 样 ， 这 个 定理 假设 每 位 参加 者 的 效用 都 是 所 谓 的 “ 拟 线性 效用 "。 此 外 ， 迈 尔 
森 收益 等 价 定理 同样 假设 不 同 竞拍 者 认为 物品 具有 的 价值 是 独立 等 概率 分 布 的 。 
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端 困难 ， 远 远 超出 了 这 本 书 的 范畴 。 我 们 现在 
是 正确 的 。 
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AN 





中 收益 等 价 定理 
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卖家 是 否 有 可 能 通过 另 一 种 拍卖 获得 更 好 的 期 望 收益 呢 ? 迈 


思维 与 人 工 智 能 








答案 就 没 那么 信人 了 。 在 1981 年 的 一 篇 美妙 的 论 


而 言 最 优 的 拍卖 法 





最 大 化 收益 ， 卖 家 就 应 





品 。 当 然 ， 这 样 做 的 话 ， 


众多 国家 里 ， 





外 国 游客 和 本 地 人 抢 着 买 相 同 的 某 件 货 物 ， 
对 待 两 者 : 可 能 只 有 在 外 国 游客 的 出 价 至 少 是 本 1 
接受 交易 。 我 们 可 以 认为 卖家 与 本 地 人 串通 抬 高 
情况 。 但 我 们 不 一 定 需要 这 种 情况 才能 解释 卖 

用 了 迈 尔 森 的 拍卖 ， 区 别 对 待 了 那些 他 认为 愿意 付出 更 高 价格 的 顾 
是 讨价还价 的 技巧 的 问题 ， 












































身 的 贝 叶 
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回 到 豪 尔 


那么 卖家 就 应 


RE RH 


尔 森 提出 的 框架 ， 





尔 森 对 此 的 肯定 














品 。 这 种 拍卖 的 技术 细节 有 些 复 杂 ， 但 其 
应 该 利用 自 
身 对 竞拍 者 实际 上 预计 肯 付 出 的 价格 的 置信 度 
卖家 从 拍卖 中 不 能 取得 任何 收益 的 概率 就 不 为 0， 但 期 户 


迈 尔 森 的 拍卖 会 让 卖家 在 协商 中 
地 人 的 出 价 的 
了 价格 


+ ABK 


森 成 功 确定 了 对 卖家 
tk 基本 想法 很 简单 。 要 


晰 偏见 。 特 别 是 ， 如 果 出 价 显然 低 于 自 


该 拒绝 出 售 这 件 物 

















的 拍卖 解释 了 为 什么 外 国 游客 的 讨价还价 那么 糟糕 。 原 因 很 简单 ， 在 
卖家 估计 外 国 游客 会 比 本 地 人 愿意 花 更 多 的 钱 。 更 粮 




















糕 的 是 ， 如 果 

















两 倍 时 ， 











的 贩卖 策略 。 





而 首先 是 一 个 关于 贝 四 
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现实 
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度 的 问题 ! 

















贝 叶 斯 主义 的 社会 影响 

迈 尔 森 拍卖 的 一 个 重要 结论 ， 就 是 贝 叶 斯 主义 者 的 最 优 行 为 会 导致 个 体 之 间 
出 现 出 于 侦 见 的 卜 视 。 这 不 是 在 说 应 该 出 于 伦理 的 理由 和 否定 迈 尔 森 的 理论 。 迈 尔 
森 的 理论 是 一 个 数学 定理 ， 并 不 依赖 任何 伦理 基础 ， 没 什么 可 和 否定 的 。 同 样 ， 在 
这 个 情况 中 ， 因 为 贝 叶 斯 推理 会 导致 在 道德 上 不 如 人 意 的 结果 而 将 其 禁止 ， 就 像 
因为 百 万 富翁 们 借助 思考 变 得 越 来 越 富有 而 禁止 其 思考 一 样 。 

迈 尔 森 的 理论 中 出 现 的 道德 价值 就 在 卖家 和 买 家 的 偏好 之 中 。 如 果 说 有 什么 





需要 斗争 的 话 ， 那 就 是 卖家 和 买 家 那些 在 伦理 上 值得 商检 的 偏好 。 然 而 ， 
的 理论 真正 指出 的 是 ， 卖 家 情 有 可 原 而 又 微不足道 的 














迈 尔 森 


局 好 也 可 以 导致 在 道德 上 被 
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社会 唾弃 的 行为 。 问 题 通常 不 在 于 收视 的 始作俑者 希望 加 害 他 人 ， 而 在 于 他 们 没 
有 足够 的 勇气 去 做 正确 的 事 。 最 严重 的 过 错 中 的 真正 问题 通常 并 不 是 造成 损害 的 














意愿 ， 而 是 缺少 不 造成 损害 的 意愿 。 
当然 ， 迈 尔 森 拍卖 的 情景 按理 说 并 非 如 此 富有 争议 
怨 他 们 遭受 的 差异 对 待 ， 甚 至 某 些 群 体 因 为 富有 而 被 打上 烙印 。 然 而 ， 


























请 你 拒绝 





那些 看 似 更 合 情 理 的 替代 方案 。 在 招募 新 员工 、 对 嫌疑 人 进行 判决 ， 或 者 计算 保 








险 附 加 费时 ， 是 否 应 该 利用 自己 的 偏见 ? 
对 于 纯粹 贝 叶 斯 主义 者 来 说 ， 这 是 一 个 超出 知识 哲学 范畴 的 问题 。 


























我 们 面 对 











的 这 个 问题 关乎 伦理 、 道 德 、 价 值 、 目 标 和 偏好 。 纯 粹 贝 叶 斯 主义 者 在 这 些 问 题 





上 给 不 出 任何 意见 。 


但 在 决策 时 忽略 偏见 是 一 种 越 来 越 流 行 的 道德 价值 ， 特 别 是 在 知识 分 子 之 














与 我 们 之 前 看 到 的 一 样 ， 计 算 机 科学 研究 中 一 个 很 大 的 领域 就 是 保证 个 人 资料 的 





私密 性 ， 目 的 是 使 其 他 人 无 法 细 化 他 们 的 贝 叶 斯 置信 和 度 。 








然而 ， 在 某 些 情况 下 ,一 些 人 的 身体 状况 也 会 使 我 们 无 法 像 对 待 其 他 人 一 样 





同等 对 竺 他们。 将 巴黎 综合 理工 学 院 的 学 生 分 配 至 军队 的 不 同 部 门 就 是 这 样 的 问 
题 。 在 “心计 ”软件 中 ， 出 于 个 体 身 体 素 质 的 原因 ， 无 法 避免 区 别 对 待 不 同 的 学 








生 。 这 样 的 话 ， 与 其 忽略 个 体 之 间 的 差异 ， 在 道德 哲学 中 加 入 某 种 处 至 
的 合理 方法 也 许 会 更 为 妥当 。 
实际 上 ， 利 用 偏见 一 般 来 说 其 至 可 以 确定 什么 政策 更 符合 伦理 。 比 妇 
































个 体 差异 





Din, HR 


上 许多 国家 的 公共 汽车 都 要 求 乘客 向 老人 、 孕 妇 和 残疾 人 让 座 。 也 就 是 说 ， 这 些 公 





共 汽 车 都 要 求 乘客 利用 人 们 的 外 表 来 建立 偏见 ， 以 照顾 那些 更 可 能 得 益 于 


就 座 的 人 。 


更 普遍 地 说 ， 正 如 我 们 会 在 本 书 最 后 一 章 中 看 到 的 那样 ， 在 道德 哲学 的 一 个 
分 支 中 ,偏见 是 合乎 道德 的 。 这 种 道德 哲学 就 是 效果 论 。 对 于 效果 论 者 来 说 ， 只 


























有 我 们 的 行为 的 (可 能 的 ) 结果 才 是 最 重要 的 。 贝 叶 斯 效果 论 者 于 是 就 必须 利用 





























贝 叶 斯 主义 的 整个 工具 库 来 最 优化 其 行为 能 带 来 的 好 处 。 然 而， 这 个 工具 库 也 包 

















含 了 他 的 偏见 。 忽 上 略 这 些 偏见 就 是 一 种 罪过 。 
裔 见 尤其 可 以 帮助 我 们 更 快速 、 更 有 效 地 帮助 那些 需要 帮助 的 人 ， 
略 这 些 偏 见 似乎 并 不 道德 。 























因此 ， 忽 


初始 的 力量 被 注入 数 种 甚至 一 种 生命 形态 之 
中 ， 即 使 这 个 星球 一 直 按照 引力 决定 的 法 则 
周而复始 地 运动 ， 但 从 如 此 简单 的 起 点 出 
发 ， 却 演化 出 了 众多 无 限 美好 而 神奇 的 生命 
形式 ， 并 将 继续 演化 下 去 。 这 种 对 生命 的 视 
点 无 比 壮丽 。 

查尔斯 "达尔文 (1809—1882 ) 


第 卫 介 章 


达尔 文 遇 上 贝 叶 斯 


幸存 者 偏差 














在 第 二 次 世界 大 战 中 ， 英 国 空军 雇用 了 统计 学 家 亚伯拉罕 ' 瓦尔 德 研究 战机 
装甲 的 最 优化 。 英 国 空军 注意 到 ， 除 了 前 部 发 动机 所 在 之 处 以 外 ， 从 战斗 中 返 
的 战机 被 打 得 遍体鳞伤 。 于 是 空军 得 出 结论 ， 应 该 减轻 前 部 装甲 来 强化 后 部 装甲 。 
瓦尔 德 尺 呼 : 这 不 对 ! 他 的 看 法 是 ， 事 情 正好 相反 ， 飞 机 只 有 后 部 中 弹 证 明了 应 
该 加 强 飞 机 的 前 部 装甲 。 

瓦尔 德 的 这 个 说 法 相当 惊人 。 但 这 其 实 本 质 上 类 似 于 查尔斯 * 达尔文 对 生物 
中 复杂 结构 的 出 现 做 出 的 解释 。 在 这 两 种 情况 下 ， 我 们 当中 大 部 分 人 所 忽略 的 微 
妙 之 处 正 是 淘汰 的 过 程 ， 或 者 说 ， 我 们 注意 的 只 是 选择 中 的 幸存 者 。 在 瓦尔 德 的 
情况 中 ， 被 淘汰 的 就 是 那些 前 部 中 弹 的 飞机 ， 这 些 飞机 的 发 动机 被 摧毁 甚至 爆炸 ， 
因此 无 法 返航 。 与 之 相似 的 是 ， 达 尔 文 断言 那些 因 缺 陷 而 无 法 繁衍 的 动物 物种 不 
可 避免 走向 灭亡 ， 因 此 ， 在 至 今 仍然 存活 的 物种 中 ， 重 大 缺陷 极 少 。 
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达尔 文 的 演化 理论 受到 了 科学 界 的 一 致 赞赏 ,但 时 至 今日 ， 它 仍 有 许多 伪 科 
学 的 批评 者 。 智 能 设计 论证 正 是 这 些 人 用 以 反驳 的 工具 ， 这 项 论证 如 下 。 想 象 一 
下 你 在 沙漠 的 正中 ， 如 果 你 偶然 发 现 一 块 奇形怪状 的 石头 ， 那 么 你 不 会 惊奇 于 它 
是 自然 过 程 的 产物 。 然 而 ， 如 果 你 发 现 了 一 块 结构 精巧 的 钟表 ， 那 么 认为 它 可 以 























通过 完全 自然 的 过 程 产 生 ， 似 乎 太 思 春 了 。 钟 表 的 精巧 结构 似乎 只 能 用 有 一 位 拥 

















有 智慧 的 设计 师 精 心 制作 来 解释 。 同 样 ， 人 体 那 令 人 惊叹 的 精巧 结构 ， 从 骨骼 与 
肌肉 的 生物 力学 ， 到 免疫 系统 的 组 织 ， 再 到 灵巧 的 眼睛 以 及 复杂 得 难以 理解 的 大 





脑 ， 都 只 能 是 智能 设计 的 结果 ， 而 这 位 拥有 智慧 的 设计 者 只 能 是 上 帝 。 





这 个 论证 可 能 看 上 去 很 有 说 服 力 。 然 而 ， 除 了 其 中 将 “拥有 智慧 的 设计 者 ” 
与 上 帝 混为一谈 这 一 点 值得 商检 以 外 ， 它 也 低估 了 我 们 上 文 所 说 的 淘汰 过 程 一 一 








达尔 文 将 其 称 为 自然 选择 。 


加 利 福 尼 亚 的 五 彩 蜥 蝎 








我 们 现在 来 到 美国 加 利 福 尼 亚 州 的 中 央 谷 地 ， 那 里 生活 着 三 种 不 同 的 雄性 蜥 
W., 粗略 来 说 ， 它 们 是 杰 色 蜥 蝎 、 蓝 色 蜥 蝎 和 黄色 蜥 蝎 。 这 些 雄 性 蜥 蝎 属 于 同一 




















物种 ， 所 以 它们 会 寻求 与 同一 种 雌性 蜥 蝎 进 行 繁殖 。 但 它们 在 索 殖 上 拥有 截然 不 

















同 的 特性 和 策略 : 栖 色 蜥 蝎 非 常 粗 暴 ， 它 们 控制 着 特定 的 领地 ， 并 且 与 自己 领地 
中 的 所 有 雌性 交配 ; 蓝 色 蜥 蝎 是 忌妒 心 很 重 的 “一 夫 一 妻 制 ” 实 行者 ， 它 们 会 控 





























就 飞 扑 上 去 。 
达尔 文 的 演化 理论 指出 ， 最 有 能 力 繁 衍 的 蜥 蝎 就 是 能 够 存续 的 那些 蜥 蝎 。 
而 有 趣 的 是 ， 不 同 雄 性 蜥 蝎 的 繁殖 能 力 取决 于 当前 其 他 的 雄性 蜥 蝎 种 群 。 











制 伴侣 的 一 举 一 动 ; 最 后 ， 黄 色 蜥 蝎 是 那 种 偷偷 摸 摸 的 花花 公子 ， 只 要 磁 到 雌性 


然 


举 个 例子 ， 假 设 大 部 分 雄性 蜥 蝎 是 粗暴 的 橙色 蜥 蝎 。 这 样 的 话 ， 每 只 橙色 师 
蝎 都 会 占据 一 个 庞大 的 “后 宫 "”， 从 而 无 法 很 好 地 监视 雌性 蜥 蝎 。 这 时 ， 偷 偷 摸 摸 
的 黄色 蜥 蝎 很 容易 就 能 与 那些 未 被 监视 的 雌性 蜥 蝎 “ 幽 会 "， 这 样 的 话 ， 雌 性 蜥 蝎 
因 偷偷 摸 摸 的 黄色 蜥 蝎 受 精 的 可 能 性 比 因 粗暴 的 橙色 蜥 蝎 受 精 的 可 能 性 高 。 我 们 























预期 偷偷 摸 摸 的 黄色 蜥 蝎 的 数量 会 逐渐 超过 粗暴 的 橙色 蜥 蝎 。 
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现在 想象 一 下 ， 占 主流 的 是 偷偷 摸 摸 的 黄色 蜥 蝎 。 那 么 嫉妒 的 蓝 色 蜥 蝎 就 可 
以 诱惑 肉 性 并 据 为 已 有 ， 这 样 的 话 ， 所 有 雌性 蜥 蝎 就 会 逐步 与 蓝 色 蜥 蝎 结 合 。 因 
此 ， 偷 偷 摸 摸 的 黄色 蜥 蝎 就 无 法 找到 名 花 无 主 的 雌性 蜥 蝎 ， 从 而 无 法 繁衍 。 于 是 
嫉妒 的 蓝 色 晰 蝎 就 会 导致 偷偷 摸 摸 的 黄色 蜥 蝎 灭 绝 。 

最 后 ， 我 们 假设 绝 大 部 分 雄性 蜥 蝎 是 嫉 妨 的 蓝 色 蜥 蝎 。 这 样 的 话 ， 粗 暴 的 楼 
色 蜥 蝎 就 会 与 这 些 嫉 妨 的 蓝 色 蜥 蝎 争 斗 ， 将 肉 性 蜥 蝎 一 个 一 个 地 扩充 进 自己 的 
“后 宫 ”。 这 些 嫉 妨 的 蓝 色 蜥 蝎 就 都 会 变 成 单身 ， 也 无 法 繁衍 。 它 们 最 后 就 会 消失 ， 
而 获 益 的 是 那些 粗暴 的 橙色 蜥 蝎 。 

总 结 一 下 ， 大 体 来 说 ， 柳 色 会 输 给 黄色 ， 黄 色 会 输 给 蓝 色 ， 而 蓝 色 会 输 给 楼 
色 。 这 跟 “ 石 尖 、 剪 刀 、 布 ”很 相似 ,石头 能 打败 剪刀 ， 剪 刀 能 打败 布 ， 而 布 能 
打败 石头 。 这 个 博弈 拥有 唯一 的 纳什 均衡 ， 就 是 随机 选择 这 三 个 选项 。 这 也 在 意 
料 之 中 。 人 们 在 现实 中 观察 到 这 三 种 雄性 蜥 蝎 在 自然 环境 下 共同 存在 ， 就 像 是 它 
们 根据 “石头 、 剪 刀 、 布 ”的 纳什 均衡 进行 了 选择 一 样 ! 也 就 是 说 ， 昌 然 纳什 均 
衡 这 个 概念 本 来 只 能 由 拥有 智慧 的 参与 者 实 施 ， 但 它 似 乎 也 完全 可 以 应 用 到 达尔 
文 式 演化 的 结果 上 。 我 们 会 看 到 这 并 非 偶然 。 































































































洛 特 卡 - 沃 尔 泰 拉动 力学 * 





生物 学 家 约翰 RENE + 史密斯 在 1972 年 提出 了 演化 稳定 策略 这 一 概念 。 
史密斯 将 这 种 策略 定义 为 种 群 的 特定 构成 ， 在 遭受 构成 不 同 的 ( 相对 较 小 的 ) 外 
来 种 群 入 侵 时 ( 比如 投放 100 只 黄色 雄性 蜥 蝎 ) 也 能 维持 稳定 。 在 现实 中 ， 这 一 
般 对 应 着 种 群 由 于 统计 涨 落 产生 的 随机 变化 。 这 种 统计 涨 落 是 否 会 对 种 群 产生 深 
远 影 响 ? 或 者 说 ， 达 尔 文 式 演化 是 否 会 将 种 群 的 构成 重新 引 向 统计 涨 落 出 现 之 前 
的 状态 ? 

为 了 回答 这 些 问题 ,我们 将 会 深入 、 细 致 地 探索 达尔 文 式 演化 的 一 个 简化 
模型 。“ 所 有 模型 都 是 错 的 "， 但 我 们 将 要 谈 到 的 模型 对 于 众多 生物 学 家 来 说 相当 
有 用 。 

S x(t) 为 某 个 变种 的 个 体 在 时 刻 t 的 数量 。 在 下 一 代 t+1 中 ， 我 们 知道 种 群 的 
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个 体 数量 需要 加 上 出 生 的 数量 并 减 去 死亡 的 数量 。 这 些 出 生 数 量 和 死亡 数量 大 概 与 
种 群 个 体 数量 成 正比 ， 相 应 比例 就 是 出 生 率 〈( 记 作 Le ) 和 死亡 率 OE AA )。 
于 是 种 群 大 小 就 会 变 成 x+D=x(D+(% 局 ) x(£) - (968) x(f) 2x(t) +(% © —-%A) x(t)« 
也 就 是 说 ， 种 群 变 化 幅度 与 种 群 大 小 x(?) 成 正比 。 令 适应 度 fitness =% e -AAAF 
比例 。 我 们 由 此 就 得 到 了 支配 种 群 大 小 演化 的 方程 : x= x(t +1) — x(t) = fitness x « 

上 面 的 方程 对 于 特定 变种 的 个 体 来 说 是 成 立 的。 我 们 现在 用 下 标 i 区 分 不 同 变 
种 ， 就 能 得 到 洛 特 卡 - 沃 尔 泰 拉 ( Lotka- Volterra ) 7; fix, = fitness, .x,。 这 些 方程 
更 准确 ， 指 出 了 不 同 变种 的 适应 度 是 如 何 随 着 其 他 变种 种 群 大 小 而 变化 的 。 正 如 
我 们 之 前 看 到 的 那样 ， 当 粗暴 的 橙色 蜥 蝎 在 种 群 中 占 优 时 ， 偷 偷 摸 摸 的 黄色 蜥 蝎 
的 适应 度 就 会 增加 o 

然而 ， 我们 感 兴趣 的 不 是 种 群 中 每 个 变种 i 的 个 体 数 目 x,， 而 是 每 个 变种 i 所 
占 的 比例 = 。 在 进行 一 些 代数 运算 之 后 ( 留 作 练习 )， 我 们 就 得 到 了 支配 种 群 中 不 
同 变 种 所 占 比例 变化 的 方程 : 


z (t | 1)= 







































































(1 t fitness, ) z, (t) 
(1+ fitness, )z, (t) za + fitness, )z, (t) 


你 猜 到 了 吗 ? 支配 演化 的 方程 不 过 是 伪装 之 后 的 贝 叶 斯 公式 ! 实在 难以 置 
信 ! 与 主观 概率 对 应 的 是 比例 z,。 从 1 变 为 t+1 时 ， 这 些 概率 会 依据 某 种 贝 叶 斯 推 
断 过 程 产生 变化 ， 其 中 的 思想 实验 项 由 1+ fitness, 人 代替。 最后， 分母 是 配 分 函数 ， 
可 以 保证 z, 的 和 在 1+1 时 仍然 为 1。 

这 就 是 经 过 分 析 后 令 人 目瞪口呆 的 结果 。 如 果 将 时 刻 上 的 适应 度 看 作 理论 守 解 
释 直 到 时 刻 上 所 得 到 数据 的 能 力 ， 那 么 达尔 文 式 演化 与 理性 客体 毫 无 二 致 ! 

这 种 比较 也 许 看 似 范 泌 ， 却 有 男 一 引 人 注 目的 定理 作为 佐证 ( 即使 它 在 数学 
上 是 显然 的 )。 这 个 定理 由 生物 学 家 约 输 . 梅 纳 德 . 史密斯 在 1973 年 证 明 ， 它 断 
言 达尔 文 式 演化 产生 的 种 群 变种 比例 必然 属于 纳什 均衡 。 惊 人 的 是 ， 这 些 纳什 均 
衡 对 应 着 拥有 智慧 的 理性 客体 在 博弈 中 采取 的 策略 。 换 句 话 说 ， 正 如 沙漠 中 的 钟 
表 一 样 ， 纳 什 均衡 所 刻画 的 比例 分 配 似乎 只 能 是 出 于 智慧 客体 的 某 种 意图 的 结果 ， 




















































































































CD 洛 特 卡 - 沃 尔 泰 拉 的 经 典 形式 假设 适应 度 是 种 群 大 小 的 线性 函数 。 
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至 少 人 们 会 有 这 种 朴素 的 信念 。 但 事实 并 非 如 此 。 
看 似 是 智慧 的 果实 ， 却 只 是 达尔 文 式 演 化 不 可 避免 的 结果 。 这 就 是 梅 纳 德 ， 史 
密斯 的 这 一 定理 令 人 星 目 结 舌 的 结论 。 




















遗传 算法 














达尔 文 式 演化 远 远 不 止 是 人 类 智慧 苍白 的 复制 品 ， 实 际 上 它 能 轻易 创造 出 人 
类 智慧 也 难以 想象 的 结构 一 一 党 被 引用 的 经 典 例子 就 是 人 类 大 脑 。 虽 然 演化 知道 
怎么 将 它 设 计 出 来 ， 但 即使 有 了 超级 计算 机 ， 神 经 科学 到 现在 还 无 法 完全 理解 人 
类 大 脑 。 

来 自 达 尔 文 式 演化 的 这 种 精巧 复杂 如 此 摄 人 心 狗 ， 令 计算 机 科学 家 与 应 用 数 
学 家 转向 了 所 谓 的 遗传 算法 ， 用 以 找 出 某 些 问 题 的 答案 ， 而 除 此 以 外 的 解法 无 人 
知晓 。 这 些 遗 传 算法 除了 模仿 自然 选择 ， 还 模仿 了 杂交 与 变异 。 

比如 说 ,假设 我 们 希望 确定 一 个 访问 法 国 最 大 的 100 个 城市 的 方法 ， 使 得 路 
程 费时 最 少 。 这 个 问题 又 叫 作 旅行 推销 员 问 题 。 每 个 访问 城市 的 顺序 都 是 问题 的 
可 能 解答 ， 而 我 们 的 目标 是 找 出 最 优 的 解答 。 这 个 问题 的 难点 在 于 可 能 的 解答 有 
如 恒 河 沙 数 ， 一 共有 100! = 1019 个 可 能 的 路 线 。 即 使 我 们 将 地 球 上 所 有 超级 计算 
机 组 合 起 来 ， 列 出 所 有 排列 ， 完 成 这 一 任务 所 需 的 时 间 也 远 远 超过 了 宇宙 的 年 龄 。 

遗传 算法 对 于 这 类 问题 的 处 理 无 比 高 效 。 这 种 算法 的 原则 就 是 维持 一 个 多 样 
化 的 种 群 ， 其 中 包含 有 前 途 但 并 非 最 优 的 解答 。 在 每 一 步 欠 代 时 ， 算 法 会 选择 种 
群 中 的 两 个 解答 ， 对 其 进行 杂交 操作 ， 在 其 中 添加 ( 有益 的 ) 变异 ， 然 后 进行 选 
择 ， 其 中 最 差 的 解答 会 被 淘汰 。 奇 怪 的 是 ， 这 种 达尔 文 式 的 优化 方法 好 得 尺 人 ， 
甚至 是 许多 情况 下 最 优秀 的 解法 ! 

达尔 文 式 演化 在 这 种 情境 下 比 人 类 的 智慧 要 做 得 更 好 。 所 以 ， 自 然 的 精巧 作 


为 反驳 演化 理论 的 论点 并 不 令 人 信服 。 但 我 们 在 第 11 章 仍然 会 谈 到 这 个 问题 。 
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构筑 自己 的 意见 ? 


科学 与 伪 科 学 之 间 的 区 别 ， 是 被 称 为 “怀疑 主义 ”“ 批 判 性 思考 ”或 者 “探索 
派 ”的 思想 运动 偏好 的 话题 。 这 一 思想 运动 主要 讨论 伪 科 学 支持 者 的 常见 诡辩 与 
认 知 偏差 。 这 些 论 证 中 的 错误 的 确 相 当 粳 糕 ， 是 大 量 阴谋 论 、 替 代 医 学 和 超常 现 
象 的 基础 。 

对 于 某 些 人 来 说 ， 对 这 些 问题 的 正确 反应 是 构筑 自己 的 意见 。 然 而 ， 这 种 反 
应 的 危险 在 于 ， 有 些 事情 必须 具有 大 量 知识 或 者 经 验 储备 才能 得 出 足够 切中 要 害 
的 意见 ， 但 这 种 反应 难免 导致 对 这 些 事情 的 怀疑 ， 甚 至 是 无 法 避免 的 偏见 、 误 解 
和 错误 。 例 如 琳 达 问题 、P 值 争议 或 者 差分 隐私 的 概念 就 属于 这 一 类 情况 。 某 些 更 
重要 的 问题 ， 比 如 疫苗 的 有 效 性 、 谷 歌 和 Facebook 的 算法 ， 以 及 气候 变化 的 人 为 
因素 ， 也 都 属于 这 类 情况 。 除 非 你 花 上 好 几 年 细 细 研究 这 些 问 题 ， 和 否则 你 自己 
成 的 意见 必定 缺乏 足够 的 信息 ， 也 因此 无 足 轻重 。 

我 们 十 分 希望 即使 只 花 上 几 个 小 时 ， 最终 也 能 在 这 些 问 题 上 得 出 正确 的 答案 ， 
但 事实 远 非 如 此 。 比 如 说 在 琳 达 问题 中 ， 直 觉 会 使 我 们 的 错误 率 比 一 只 随机 选择 
答案 的 黑猩猩 的 错误 率 还 要 高 。 统 计 学 家 汉 斯 ， 罗 斯 林 就 证 明了 这 一 点 。 对 于 许 
多 问题 ， 比 如 女性 平均 受 教育 时 间 、 自 然 灾害 造成 的 死亡 人 数 、 世 界 贫 困 人 口 等 ， 
我 们 的 表现 比 无 知 还 要 糟糕 止 ， 我 们 一 贯 选择 的 都 是 错误 答案 ! 

更 糟糕 的 是 ， 要 估计 应 该 对 自己 的 直觉 有 多 少 信心 ， 对 我 们 来 说 难 上 加 难 。 
因此 ， 即 使 花 上 相当 长 的 时 间 思 考 并 汲取 有 关 某 个 问题 的 信息 ， 我 们 对 于 自己 理 
解 了 多 少 ， 以 及 自己 的 意见 是 否 考虑 了 足够 多 的 信息 ， 了 解 起 来 可 能 还 是 相当 困 
难 的 。 雪 上 加 霜 的 是 ， 德 里 克 ' 穆 勒 的 博士 论文 趾 证 明 ， 哪 怕 是 对 物理 现象 完全 
正确 的 视频 解释 ， 也 可 能 会 提高 学 生 对 自身 直觉 的 信赖 ， 即 使 学 生 刚 才 观 看 的 视 
频 解 释 完 全 否定 了 这 些 直 觉 ! 

我 们 每 个 人 都 经 历 过 太 多 次 这 种 反复 出 现 的 自信 过 度 了 。 你 可 能 也 明白 ， 这 
就 是 我 在 本 书 中 尝试 元 服 的 主要 认 知 偏差 。 这 也 是 贝 叶 斯 公式 、 埃 尔 德 什 在 蒙 
带 . 霍 尔 问题 中 遇 到 的 困难 ， 以 及 所 罗 门 诺 夫 不 完备 性 迫使 我 们 承认 的 东西 : 我 
们 总 是 过 分 自信 。 正 如 伟大 的 逻辑 学 家 伯 特 兰 . 罗素 所 言 : "世界 上 所 有 问题 的 
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根源 在 于 ,笨蛋 和 盲 信者 总 是 无 比 自信 ， 而 更 有 智 问 的 人 却 一 直 在 怀疑 。” 艾 带 
dé + WEEDS" 补充 道 :“ 要 尽量 避免 得 出 结论 。” 

实际 上 ,“ 只 靠 自 己 ” 去 相信 任何 事物 是 个 难于 登 天 的 任务 ， 其 中 布 满 无 法 逾 
越 的 障碍 。 我 很 不 建议 你 这 样 做 。 如 果 构 筑 正 确 的 意见 那么 容易 的 话 ， 那 高 等 研 
究 就 不 需要 花 那 么 长 的 时 间 了 ， 而 且 知 识 也 不 会 被 如 此 切 分 为 相互 隔绝 的 学 科 了 。 
如 果 没 有 足够 的 财力 、 时 间 和 认 知 能 力 去 沉浸 在 特定 问题 的 详细 研究 之 中 的 话 ， 
那么 我 们 就 难免 需要 依靠 他 人 的 意见 。 这 并 不 是 个 坏 习惯 。 实 用 贝 叶 斯 主义 者 也 
更 倾向 于 利用 其 他 人 在 数 十 年 其 至 数 百年 中 做 出 的 工作 来 细 化 自身 对 世界 的 理解 。 
即使 是 纯粹 贝 叶 斯 主义 者 也 知道 ， 其 他 个 体能 访问 众多 她 无 法 访问 的 数据 ， 所 以 
她 有 不 少 东 西 可 以 向 这 些 人 学 习 。 

























































































单个 科学 家 并 不 可 靠 





所 以 ， 要 理解 我 们 身 处 的 这 个 世界 ， 诉 诸 权 威 是 一 个 强大 、 有 效 且 实用 的 工 
具 。 然 而 这 也 带 来 了 下 面 的 问题 : 谁 是 最 可 靠 的 权威 ? 爱 因 斯 坦 提 出 的 论证 是 否 
比 水 士 比 亚 的 论证 更 有 价值 或 者 更 值得 相信 ? 我 们 可 不 可 以 盲目 信任 科学 家 ? 

在 面 对 这 些 问题 时 ， 某 些 探 索 派 学 者 〈 也 就 是 捍卫 批判 性 思维 的 人 ) 和 某 些 
科学 家 会 强调 科学 方法 的 客观 性 。 他 们 认为 ， 科 学 家 得 出 结论 的 方法 就 是 完全 严 
谨 、 客 观 并 且 经 过 同行 评议 的 论证 。 因 此 ， 他 们 的 结论 比 伪 科 学 家 的 结论 更 有 价 
值 ， 因 为 伪 科学 家 并 不 遵循 这 一 方法 。 

然而 ， 优 秀 的 探索 派 学 者 会 提防 这 种 粗糙 而 刻板 的 论证 。 首 先 ， 某 些 伪 科学 
或 多 或 少 遵循 的 是 科学 方法 的 路 线 。 此 外 ， 贝 叶 斯 主义 否定 了 这 种 科学 方法 的 客 
观 性 ， 甚 至 也 否定 了 它 的 正确 性 ! 但 更 重要 的 是 ， 科 学 工作 者 几乎 从 来 不 按照 科 
学 方法 做 事 。 

在 科学 文献 中 任意 选取 一 篇 论文 ， 论 文 的 作者 很 有 可 能 并 没有 提出 什么 假设 ， 
也 没有 确定 某 个 带 有 限制 的 实验 流程 ， 同 样 没有 根据 这 个 流程 来 进行 实验 ， 最 后 



































































































































(D KZ- 克 莱 因 是 法 国 的 物理 学 家 及 科学 哲学 家 。 一 一 译 者 注 
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也 没有 用 p 值得 出 结论 、 完 成 论文 。 无 论 是 现代 还 是 过 去 ,科学 更 像 是 一 连 
试 错 、 建 模 、 模 拟 、 参 数 调整 ， 以 及 实验 中 的 质疑 。 通 常 只 有 在 获得 所 有 结果 之 
后 ， 论 文 的 写作 才 开始 。 写 作 时 ， 作 者 选取 的 角度 通常 忽略 了 实 

错误 线索 ， 为 的 是 更 好 地 将 新 发 现 组 织 起 来 ， 并 推出 一 个 引 人 深 思 的 结论 一 一 大 
部 分 读者 也 觉得 这 相当 值得 赞赏 。 

更 糟糕 的 是 ， 科 学 工作 者 同样 无 法 避免 那些 导致 伪 科 学 的 认 知 偏差 甚至 诡 准 
的 茶 毒 。 这 是 因为 ， 正 如 我 们 在 第 1 章 和 第 2 章 中 看 到 的 那样 ， 即 使 是 最 优秀 的 
科学 工作 者 ， 面 对 某 些 简单 却 令 人 困惑 的 问题 也 无 能 为 力 ， 就 像 埃 尔 德 什 在 面 对 
AU c 霍 尔 问题 时 那样 。 曾 经 有 很 长 的 一 段 时 期 ， 最 优秀 的 科学 家 认为 地 球 是 宇 
害 的 中 心 外 、 儿 何必 须 是 欧 几 里 得 儿 何 外 ,或 者 人 工 神 经 网 络 是 人 工 智能 研究 的 
死胡同 一 一 当 我 在 2011 年 第 一 次 看 到 人 工 神经 网 络 的 数学 描述 时 ， 我 的 反应 就 是 
这 样 的 ! 

即使 是 伟大 的 爱 因 斯 坦 ， 做 出 过 对 于 许多 物理 学 家 来 说 如 同 奇迹 的 突破 ， 他 
也 曾经 反复 犯 下 错误 ， 比 如 在 1913 年 为 有 问题 的 广义 相对 论 前 身 做 辩护 所， 还 有 
为 了 强行 加 入 稳 态 永恒 宇宙 的 可 能 性 而 在 广义 相对 论 方程 中 引入 了 一 个 
数 四 -一 他 自己 将 其 称 为 “一 生 中 最 大 的 错误 "。 无 论 是 现在 还 是 将 来 ， 即 使 像 最 
优秀 的 科学 家 那么 聪明 的 人 ， 拥 有 的 认 知 能 力也 有 极限 。 

还 有 更 严重 的 问题 。 学 术 界 体系 中 的 一 些 激励 措施 与 对 认 知 偏差 的 永恒 斗争 
并 不 相 容 。 这 是 因为 ， 某 个 科学 工作 者 的 声誉 ,或 者 仅仅 是 保留 当前 职位 的 能 力 ， 
依赖 于 其 思想 的 独创 性 和 发 表 论文 的 数目 。 在 这 种 情况 下 ， 科 学 工作 者 有 着 充足 
的 动机 去 疯狂 捍卫 自己 的 思想 ， 而 且 通 常 超出 了 贝 叶 斯 公式 允许 的 范围 。 科 学 工 
作者 甚至 有 动机 去 杜绝 贬损 自己 过 去 提出 的 并 曾 给 自己 带 来 荣誉 的 理论 ， 即 使 这 
些 理论 最 终 被 否定 了 。 最 后 ， 科 学 工作 者 却 没有 动机 去 花 时 间 验 证 与 其 竞争 的 理 
论 的 正确 性 ， 因 为 科学 期 刊 不 会 发 表 对 已 有 理论 的 巩固 工作 。 

最 后 ， 在 某 些 极端 但 确实 存在 的 情况 中 ， 某 些 科学 工作 者 的 科研 经 费 来 源 要 
求 他 们 得 出 某 些 预定 的 结论 ， 比 如 说 那 位 向 烟草 产业 出 卖 了 灵魂 的 罗 纳 德 ， 费 硕 
尔 。 然 而 ， 我 们 也 无 法 完全 排除 这 些 不 正常 的 经 费 来 源 。 

这 几 个 论点 似乎 伤害 了 科学 工作 者 的 可 信和 度 。 此 外 ， 当 我 看 到 某 些 著名 科学 
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家 在 公开 演讲 中 使 用 某 些 论证 捷径 时 ， 我 对 他 们 的 言论 的 置信 和 度 就 遭 到 了 沉重 打 
击 。 从 我 自己 的 角度 来 说 ， 在 为 Science4All 或 ZettaBytes 制作 视频 时 ， 我 倾向 于 
极度 回避 技术 难点 ， 从 而 传递 出 令 人 信服 而 且 侥 有 趣味 的 清晰 信息 ， 因 为 这 些 视 
频 的 首要 目的 是 推广 数学 和 计算 机 科学 。 正 是 出 于 这 个 原因 ， 我 曾 多 次 向 受众 说 
议 一 一 包括 在 这 本 书 中 。 我 深 深 仰 莫 的 其 他 科学 家 在 我 之 前 也 说 过 这 种 有 意 的 议 
， 但 这 一 点 都 不 出 人 意料 。 在 介绍 哥 德 尔 的 定理 时 却 没 有 介绍 一 阶 逻 辑 的 那些 
人 ， 必 定 也 要 说 一 点 小 小 的 谎言 。 力 图 面向 一 般 大 众 推广 科学 会 迫使 我 们 在 措辞 
中 更 偏好 流畅 ， 而 非 严 刘 。 
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诉 诸 权 威 


话 虽 如 此 ， 某 些 专 家 在 某 些 特定 问题 上 的 意见 对 我 来 说 有 着 完全 不 同 的 价值 。 
我 在 预科 班 第 一 年 时 的 数学 老师 就 是 这 种 情况 。 跟 很 多 学 生 一 样 ， 我 对 他 那些 意 
见 的 重要 性 心悦诚服 。 如 果 我 们 的 想法 在 某 个 数学 问题 上 有 冲突 的 话 ， 我 不 仅 会 
立马 开始 强烈 怀疑 自己 ， 甚 至 还 会 完全 否定 自己 的 信念 。 但 更 重要 的 是 ,我 很 快 
就 会 相信 他 的 想法 ， 并 尝试 理解 这 些 想法 的 根源 。 

同样 ， 如 果 某 位 著名 科学 家 多 次 令 我 震惊 于 其 见解 中 的 智慧 ， 那 么 当 他 针对 
其 专门 领域 的 特定 问题 说 出 惊人 的 意见 时 ， 无 论 我 在 听 到 这 个 意见 之 前 相信 的 是 
什么 ， 我 对 这 位 科学 家 表达 的 意见 的 置信 和 度 都 会 急速 上 升 。 

举 一 个 例子 。 某 位 研究 逻辑 的 朋友 有 一 次 跟 我 说 ， 跟 粗糙 的 论证 以 及 维基 百 
科 上 写 的 正好 相反 ， 存 在 这 样 的 数学 模型 ， 其 中 所 有 实数 都 是 可 定义 的 。 我 曾 多 
次 见识 过 他 在 数理 逻辑 方面 的 造 训 ， 即 使 我 对 维基 百科 的 数学 页 面 有 着 很 高 的 置 
信和 度 ， 我 还 是 开始 严重 怀疑 我 此 前 的 想法 ， 甚 至 很 快 就 相信 了 我 朋友 的 说 法 ， 即 
使 我 并 不 明白 为 什么 他 会 相信 有 这 么 一 回 事 。 

无 比 奇怪 的 是 ,我 的 反应 是 理性 的 ! 这 是 因为 ， 贝 叶 斯 公式 迫使 我 们 在 这 种 
情况 下 接受 诉 诸 权 威 的 论证 。 我 们 将 某 个 权威 承认 某 个 论点 这 一 事实 记 作 @， 将 论 
点 本 身 的 正确 性 记 作 vy 或 X。 贝 叶 斯 公式 要 求 我 们 计算 下 面 的 后 验 置 信和 度 : 
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P[é|V] 
PME pep rex M 


假设 你 在 先 验 置信 度 上 和 否认 这 一 论点 ， 也 就 是 说 ，P[V]=0，P[X]=1。 
我 们 可 以 合理 地 认为 ， 如 果 论 点 正确 的 话 ， 那 么 权威 就 会 承认 它 ， 由 此 ”得 到 
Plé] = 1。 于 是 我 们 得 到 下 面 的 近似 : 


1 _ PM 
1x0 + IP[é|X]x TPM ~ P[éjX| 








Pé] = 


这 样 的 话 ， 粗 略 地 说 ， 你 对 这 一 论点 的 置信 度 会 乘 以 /PIGEIX]。 也 就 是 说 ， 当 且 
仅 当 权威 在 已 知 论点 错误 的 情况 下 非常 不 可 能 持 有 目前 的 立场 时 ， 贝 叶 斯 公式 才 
会 提示 你 接受 诉 诸 权威 的 论证 。 

这 就 解释 了 为 什么 纯粹 贝 叶 斯 主义 者 会 无 视 那 些 权 威 气候 怀疑 论 者 。 石 油 企 
业 有 着 巨大 的 经 济 效 益 ， 它 们 能 找到 愿意 捍卫 其 观点 的 人 ， 这 一 点 毫 不 令 人 意外 。 
除 此 之 外 还 有 巨大 的 选择 性 偏差 。 如 果 某 个 节目 愿意 给 气候 怀疑 论 者 提供 发 声 的 
渠道 ， 那 么 受 邀 者 捍卫 气候 怀疑 论 的 概率 必然 等 于 1， 即 使 他 的 论点 是 错误 的 。 
尽管 如 此 ， 这 个 论证 对 于 对 立 阵营 同样 有 效 。 即 使 气候 变 暖 是 错误 的 ， 某 位 
激进 环保 主义 者 为 气候 变 暖 辩护 的 概率 仍然 接近 于 1。 如 果 激 进 环保 主义 者 可 以 这 
样 说 的 话 ， 那 么 那些 被 邀请 到 媒体 上 露面 的 科学 工作 者 也 可 以 这 样 说 ， 这 出 于 我 
们 在 上 面 说 过 的 那些 认 知 偏差 ， 而 科学 工作 者 也 是 这 些 偏差 的 受害 者 。 一 言 以 项 
之 ， 对 于 类 似 气候 变 暖 这 样 牵涉 重大 经 济 或 政治 利益 的 富有 争议 甚至 引起 意见 两 
极 分 化 的 问题 ， 诉 诸 权威 的 论证 几乎 毫 无 效果 。 

更 一 般 来 说 ， 贝 叶 斯 公式 表明 ， 如 果 你 知道 某 个 人 要 说 什么 ， 那 么 你 听 他 说 
话 也 学 不 到 什么 。 更 准确 的 说 法 是 ， 如 果 你 已 经 知道 某 位 权威 的 立场 ， 那 么 你 对 
某 个 论点 的 置信 度 就 不 可 能 因 这 位 权威 展露 其 立场 而 合理 地 上 升 。 原 因 在 于 ， 如 
果 你 几乎 确定 某 个 人 会 文 持 这 个 论点 ， 也 就 是 说 ， 假 设 PI@] 1, 那么 通过 贝 叶 
斯 公式 就 能 得 出 下 面 的 近似 : 






























































































































































P[é| V] 
PIG 





P[V]é] = PIV] ~ P|é| V ]P|v] 





D 只 要 pé] 不 是 特别 小 ， 论 证 仍然 成 立 。 
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然而 所 有 概率 都 小 于 等 于 1。 于 是 我 们 有 PIGIV] 三 1， 由 此 可 以 得 到 ( 近似 的 ) 
不 等 式 P[VI@] S PLA]. 所 以 诉 诸 权威 的 论证 并 不 成 立 "“。 这 个 贝 叶 斯 定理 的 推论 ， 
就 是 如 果 对 方 ( 贝 叶 斯 主义 者 ) 知道 你 想 说 什么 ， 那 么 你 说 的 话 就 不 会 改变 对 方 
的 信念 。 

反之 ,我 那 位 研究 数理 逻辑 的 朋友 说 的 话 令 我 无 比 惊 讶 。 因 此 ， 假设 他 的 断 
言 没 有 根据 ， 那 么 他 做 出 如 此 断言 的 概率 PAX 几乎 是 0。 实 际 上 ， 这 一 概率 其 
至 小 于 我 对 于 自己 的 推理 和 维基 百科 都 出 错 的 先 验 置信 度 ， 即 使 这 些 置信 和 度 本 刁 
已 经 非常 微小 。 正 因 如 此 ， 在 我 们 讨论 之 后 ， 即 使 不 理解 那 位 朋友 的 论证 ， 我 还 
是 心悦诚服 地 认为 他 是 对 的 口 。 

所 以 ， 有 时 候 我 相信 某 些 自己 没有 理解 的 事情 。 甚 至 可 以 说 ， 我 之 所 以 相信 
这 些 事情 ， 都 是 因为 诉 诸 权威 的 论证 。 有 些 人 断言 这 不 是 理性 的 。 然 而 ， 即 使 我 
当下 不 知道 这 些 事情 是 否 正确 ， 这 事实 上 也 是 唯一 理性 的 后 验 立场 一 一 至 少 在 相 
信 贝 叶 斯 公式 的 情况 下 外。 

































































科学 共识 


我 们 回 到 气候 变化 的 问题 。 我 们 已 经 看 到 ， 任 何 一 位 科学 工作 者 都 不 能 作为 
权威 。 此 外 ， 与 其 挑 出 某 位 气候 学 的 专家 ， 探 索 派 学 者 通常 更 重视 气候 学 界 的 意 
见 。 然 而 意见 只 有 一 个 ， 气 候 学 界 的 绝 大 部 分 工作 者 相信 和 气候 在 变化 ， 而 且 这 种 
变化 来 源 于 人 类 一 一 在 报道 中 ， 这 个 群体 中 这 样 认 为 的 人 数 通常 超过 98%。 但 如 
果 每 一 位 科学 工作 者 都 不 可 信和 的话， 为 什么 整个 学 界 的 意见 就 更 为 可 信 呢 ? 

对 于 这 个 问题 ， 纯 粹 贝 叶 斯 主义 者 有 一 个 重要 的 答案 : 与 每 个 成 员 相 比 ， 科 
学 共同 体 对 贝 叶 斯 公式 的 应 用 更 恰当 。 如 果 将 科学 共同 体 想象 成 一 块 土地 ， 那 么 
不 同 的 理论 了 则 是 在 这 块 土地 上 生活 着 的 不 同 物种 的 动物 。 在 每 个 时 刻 +， 最 令 人 
信服 的 理论 更 能 繁衍 下 去 。 这 些 理 论 更 容易 被 科学 工作 者 所 接受 。 我 们 将 在 时 刻 t 












































中 我们 仍然 可 以 合理 地 假设 ， 在 自身 论题 正确 的 情况 下 ， 权 威 人 士 为 其 辩护 的 可 能 性 至 少 等 同 
于 论题 错误 时 的 可 能 性 ， 这 样 的 话 ， 我 们 就 有 不 等 式 PI@IV] > PIGEIX]。 在 这 个 情况 下 ,我 
们 的 确 有 PIVI@] PIV]， 也 就 是 说 ,你 即使 知道 @ 也 并 没有 学 到 什么 。 
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接受 某 个 理论 7 的 科学 工作 者 的 比例 记 作 pj(D， 洛 特 卡 - 沃 尔 泰 拉 方 程 就 能 应 用 
到 思想 的 演化 上 ?: 

fitness (1,7) pr (t) 

i fitness(t, T) Pr (t) + D fitness (t, A) p, (t) 


A+T 





p; (t i 1) 


你 明白 我 要 说 什么 了 吗 ? 不 同 理论 在 科学 共同 体 中 的 达尔 文 式 演化 ， 正 是 伪 
装 过 的 贝 叶 斯 推断 ! 

换 句 话 说， 这 就 像 是 科学 共同 体 应 用 了 贝 叶 斯 公式 来 使 最 可 信 的 理论 脱 颖 而 
出 。 正 因 如 此 ， 科 学 共同 体 理 应 拥有 的 置信 度 要 远 远 超越 其 中 任何 个 体 的 意见 。 
只 要 理论 的 适应 度 与 思想 实验 项 相关 ， 那么 科学 共同 体 就 比 其 中 任何 个 体 都 更 能 
贴切 地 应 用 贝 叶 斯 公式 >。 





















































“标题 党 ” 








通过 类 比 ， 我 们 可 能 会 认为 某 个 群体 中 最 普遍 的 意见 也 是 最 可 信 的 。 这 一 论 
点 在 人 们 维护 民主 原则 时 经 常 被 引用 ,但 它 却 是 一 种 雇 误 。 原 因 很 简单 : 在 某 个 
群体 中 传播 得 最 广 的 理论 ， 也 就 是 适应 度 最 高 的 理论 ， 并 不 一 定 是 最 可 信 的 理论 ， 
而 是 传播 性 最 强 的 理论 PL 

在 2016 年 美国 总 统 大 选 结 果 刚 刚 出 炉 之 后 ， 德 里 克 … 穆 勒 就 在 视频 频道 
Veritasium 上 发 布 了 一 个 视频 5， 承认 了 自己 一 开始 有 着 天 真 的 乐观 心态 。 跟 许多 
人 一 样 ， 他 认为 互联 网 能 够 让 人 们 更 快 地 分 享 真相 。 他 期 望 这 会 让 整个 世界 趋向 
于 共同 的 价值 观 和 (对 科学 的 ) 信仰 。 然 而 ， 正 如 称 勒 自己 解释 的 那样 ， 现 实 并 
非 如 此 。 穆 勒 观 察 到 了 这 种 分 收 ， 其 至 看 到 了 意识 形态 的 两 极 化 。CGP Grey 的 视 
频 中 似乎 隐藏 了 对 此 现象 的 解释 US CGP Grey 提出 ， 某 个 理论 在 互联 网 上 的 扩散 
能 力 首先 取决 于 它 引 发 情绪 反应 的 能 力 ， 而 不 在 于 它 解释 观察 数据 的 能 力 。 也 就 
是 说 ， 就 像 情绪 一 样 时， 不 同 的 理论 在 互联 网 以 及 一 般 大 众 中 的 适应 度 似乎 与 它 
























































D 为 了 方便 ， 不 失 一 般 性 ， 我 将 fitness+1 换 成 了 fitness. 
© 我们 甚至 可 以 再 加 上 科学 共同 体 对 不 同 理论 的 探索 以 及 我 们 在 第 17 章 会 谈 到 的 MCMC 算法 
之 间 的 相似 之 处 。 
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们 的 “标题 党 ”效应 有 着 更 紧密 的 联系 ， 而 不 是 贝 叶 斯 公式 中 的 思想 实验 项 。 

更 糟糕 的 是 ,根据 伯 杰 和 米尔 克 曼 的 一 篇 论文 1, CGP Grey 指出 ， 传 播 得 最 
广 的 理论 正 是 那些 会 引发 贷 怒 的 理论 ， 而 在 面 对 其 他 同样 会 引发 债 怒 的 对 立 理论 
时 ,这 些 理论 更 能 有 效 传播 。 因此， 两 个 针锋相对 的 理论 就 有 如 两 个 共生 的 物种 。 
它们 互相 滋养 ， 共 同 占据 整个 生存 领域 。 

也 就 是 说 ， 网 络 上 那些 理论 的 适应 度 有 利于 意识 形态 的 两 极 化 ， 以 及 助长 两 
个 互相 对 立 的 理论 各 自 的 支持 者 之 间 的 愤恨 ， 而 这 本 质 上 与 这 些 理 论 的 逻辑 基础 
和 经 验 基础 毫 无 关系 。 这 也 许 就 是 21 世纪 初 以 来 极端 意识 形态 抬头 的 原因 41, 

在 更 普遍 的 情况 下 ， 那 些 或 简短 或 信人 、 或 激昂 或 慎 焉 、 或 动人 或 感伤 、 有 
时 诱惑 、 有 时 批评 、 有 时 充满 野心 、 有 时 暗藏 诡计 、 有 时 党 同 伐 异 、 有 时 激进 极 
端 、 有 时 造谣 中 伤 、 有 时 血泪 控诉 ， 甚 至 毫 无 根据 的 信息 ， 它 们 的 传播 似乎 能 与 
危险 的 肿瘤 相 比 。 在 整个 社会 的 尺度 中 ,“ 标 题 党 ”似乎 更 青睐 那些 短视 且 断 然 的 
政治 立场 、 不 安全 感 以 及 毫 无 根据 的 希望 ， 而 不 是 那些 有 根 有 据 、 深 思 熟 虑 的 长 
远视 角 。 但 更 重要 的 是 ， 它 让 民主 投票 变 得 盲目 、 偏 鼎 且 非 理 性 。 



















































































市 场 的 预测 能 力 





一 位 经 济 学 家 曾 给 一 般 的 投票 者 绘制 了 一 幅 令 人 有 些 不 悦 的 画像 。 根 据 美 国 
选举 与 民意 调查 结果 的 经 验 数据 ， 一 般 投 票 者 比 一 无 所 知 的 人 的 决定 还 要 糖 糕 。 
一 般 投票 者 甚至 是 非 理性 的 ， 经 济 学 家 甚至 利用 经 济 学 模型 解释 了 这 一 结论 。 这 
个 模型 的 核心 是 一 个 观察 结果 : 任何 一 张 选票 产生 任何 影响 的 概率 都 几乎 是 0。 这 
样 的 话 ， 投 票 时 利用 选票 表达 自己 非 理 性 信念 带 来 的 这 种 愉悦 就 会 远 远 超 出 依据 
理性 投票 带 来 的 那些 非常 不 可 能 出 现 的 影响 ， 而 依据 理性 投票 需要 强大 的 认 知 能 
力 。 也 就 是 说 ， 一 般 投票 者 理性 地 选择 了 非 理 性 US, 

有 人 提出 了 民主 决策 的 替代 方案 : 资本 主义 和 市 场 规律 。 有 人 甚至 断言 ， 正 
因为 有 了 市 场 和 游说 集团 ， 美 国 的 民主 才 没 有 陷入 由 唯利是图 、 过 度 监管 与 严重 
的 保护 主义 组 成 的 混乱 。 因 此 ， 在 美国 ， 移 民权 利 最 大 的 保护 者 并 不 是 美国 民众 ， 
而 是 谷歌 、Facebook 之 类 的 企业 ， 它 们 的 经 济 实力 强烈 依赖 于 担任 公司 中 大 部 分 
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职位 的 高 技术 移民 ， 而 这 些 企业 的 营业 额 也 强烈 依赖 于 自身 在 国际 上 的 形象 。 

美国 国防 部 高 级 研究 计划 局 建立 了 “政策 分 析 市 场 ”〈《PAM ) 系统 。 在 这 个 在 
线 市 场 中 ， 网 民 可 以 向 不 同 的 假设 下 注 ， 比 如 美军 在 伊拉克 的 伤亡 人 数 ， 或 者 下 一 
年 是 否 会 出 现 针对 以 色 列 的 恐怖 袭击 。 你 也 大 概 能 想象 到 ， 由 美国 政府 倡 时 的 这 一 
新 项 目 饱 受 批评 ,很 快 就 获得 了 “ 泡 饰 市 场 ”的 称号 。 这 一 项 目 立 刻 就 被 终止 了 。 

然而 ,初步 分 析 表明 这 是 一 个 极 有 和 希望 的 方法 。 惊 人 的 是 ， 这 种 在 线 博彩 
场 似乎 能 出 奇 有 效 地 进行 预测 ， 比 如 赛马 结果 或 选举 结果 。 参 与 者 的 想法 非常 接 
近 实 际 最 终 发 生 的 情况 。 毕 竟 这 跟 民 主 投票 不 同 ， 赌 上 的 是 真 金 白银 ， 因 此 参与 
者 在 表达 意见 之 前 会 仔细 花 长 时 间 搜 寻 信 息 并 思考 。 更 妙 的 是 ， 跟 选举 中 的 投票 
者 不 同 ， 如 果 博 彩 的 参与 者 对 于 自己 的 预测 没有 足够 的 置信 和 度 ， 他 们 就 不 会 表达 
自己 的 意见 。 这 样 的 话 ， 他 们 就 不 会 用 盲目 、 偏 颇 且 非 理性 的 信念 污染 整体 数据 。 

然而 ， 将 市 场 的 预测 能 力 归结 于 参与 者 的 专业 素养 是 一 种 错误 。1988 年 ,《 华 
尔 街 日 报 》 的 4 名 员工 做 了 一 件 好 玩 儿 的 事情 ， 就 是 在 股票 上 随机 下 注 。 每 个 月 
他 们 都 用 飞镖 来 选择 一 份 要 买 和 人 的 股票 。 之 后 月 复 一 月 ， 他 们 将 作为 飞镖 玩家 的 
收益 率 与 4 位 专业 投资 人 的 收益 率 进行 比较 。 在 100 个 月 之 后 ， 他 们 总 结 了 结 
飞镖 玩家 在 100 次 中 有 39 次 打败 了 专业 投资 人 。 也 就 是 说 ， 专 业 投资 人 获胜 的 优 
势 并 不 明显 。 更 糟糕 的 是 ， 几 位 经 济 学 家 表明 ， 即 使 说 专业 投资 人 绪 得 了 胜利 ， 
那 也 都 是 因为 《华尔街 日 报 》 刊 登 了 他 们 对 股票 的 选择 ， 从 而 形成 了 一 种 广告 效 
应 ! 最 糟糕 的 是 ， 即 使 有 这 种 偏差 ， 专 业 投 资 人 在 100 次 中 也 只 有 51 次 跑 启 大 市 
平均 盘 利 水 平 〈 又 叫 道琼斯 平均 指数 ) 09。 

诺 贝 尔 经 济 学 奖 得 主 丹尼尔 * 卡 内 曼 曾 经 仔细 研究 过 投资 者 与 市 场 。 他 发 现 
的 情况 对 投资 者 而 言 更 加 严峻 。 他 发 现 ， 交 易 员 的 每 月 评级 在 连续 几 个 月 之 间 几 
乎 没有 任何 关联 ,仿佛 交易 员 的 成 功 就 是 独立 同 分 布 的 随机 变量 。 此 外 ， 卡 内 蝇 
出 最 成 功 的 交易 员 在 市 场 上 最 不 活跃 ， 这 就 像 是 在 说 ， 要 获得 最 大 的 利润 ， 只 
需要 请 目 信 赖 市 场 ， 而 不 是 尝试 跑 赢 市 场 "7。 

所 有 这 些 经 验 都 似乎 一 次 又 一 次 地 表明 ， 市 场 比 其 中 任何 一 个 投资 者 都 更 有 
能 耐 ， 更 不 用 说 跟 我 们 中 的 任何 一 个 人 比 了 。 这 怎么 可 能 ? 

我 在 这 里 的 解答 跟 之 前 对 科学 共同 体 意见 的 重要 性 的 解释 一 样 : 市 场 对 贝 叶 
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类 公式 的 应 用 要 比 市 场 中 的 任 一 位 参与 者 对 它 的 应 用 更 准确 ! 为 了 理解 这 一 点 ， 
我 们 先 将 每 位 投资 者 的 大 脑 考虑 成 一 个 预测 理论 。 作 为 合格 的 贝 叶 斯 主义 者 ， 我 
们 希望 对 那些 做 出 过 正确 决定 的 大 脑 增 加 置信 和 度 ， 而 对 那些 做 出 过 错误 决定 的 大 
脑 减少 置信 和 度 。 你 猪 到 了 吧 ， 这 就 是 市 场 做 的 事情 ! 

为 说 明 这 一 点 ， 考 虑 某 位 投资 者 To S fortune(T, 作为 7 在 时 刻 t 的 财富 。 根 据 市 
场 的 累 乘 性 质 ， 他 在 下 一 个 时 刻 的 财富 就 是 fortune(T, t+1)=perf(7, £ * fortune(T, Ao 
这 下 是 之 前 的 洛 特 卡 - 沃 尔 泰 拉 方 程 ,但 种 群 中 的 变种 i 变 成 了 投资 者 7， 而 变种 
的 适应 度 fitness 变 成 了 投资 者 的 表现 perf。 

如 果 我 们 考虑 投资 者 7 在 时 刻 1 的 市 场 份额 part(7, f) 的话， 就 能 得 到 如 下 的 
演化 方程 : 






























































perf (T, t)part(T, t) 
perf (T, t)part(T, t)+ > perf (4, t)part (4, t) 


A+T 





part(T, t+1)= 














其 中 4 代表 的 是 了 以 外 的 投资 者 。 我 们 又 一 次 得 到 了 某 种 贝 叶 斯 推断 ! 与 之 前 一 
样 ， 股 票 市 场 整体 对 贝 叶 斯 公式 的 应 用 比 其 中 任何 一 位 成 员 都 要 好 。 与 科学 共识 
一 样 ， 市 场 共识 似乎 也 比 任何 一 位 市 场 专 家 更 可 靠 ! 

但 这 个 分 析 中 有 三 个 可 商检 之 处 。 第 一 点 就 是 市 场 预 测 与 贝 叶 斯 的 预测 相反 ， 
它 并 不 是 投资 者 各 自 预测 的 加 权 平 均值 。 实 际 上 ， 将 投资 者 的 预测 转化 为 市 场 预 
测 的 机 制 更 像 是 加 权 中 位 数 ， 而 不 是 加 权 平 均值 ， 因 为 均衡 价格 会 将 投资 者 分 成 
两 部 分 ， 认 为 这 一 价格 过 低 的 那 一 部 分 正 是 那些 会 向 其 投资 的 人 (这 也 就 会 让 价 
格 上 升 )。 此 外 关键 在 于 ， 投 资 者 的 市 场 份额 越 大 ， 他 对 均衡 价格 的 影响 也 越 大 。 

其 余 两 个 可 商检 之 处 的 问题 就 更 大 了 。 首 先 ， 我 们 必须 考虑 持续 流入 的 新 投 
资 者 ， 他 们 的 财富 并 非 来 自 市 场 中 的 博弈 。 最 引 人 注 目的 例子 就 是 以 比特 币 为 代 
表 的 所 谓 的 “加 密 货币 ”， 相 关 新 投资 者 的 资金 并 不 是 通过 以 往 的 正确 投资 方法 册 
来 的 。 这 些 新 投资 者 的 流入 就 像 是 给 那些 从 未 自 证 的 理论 带 来 了 额外 收益 。 正 因 
如 此 ， 这 种 流入 也 消去 了 这 些 理论 在 过 去 造成 的 挫败 。 这 就 像 消去 了 市 场 的 长 期 
记忆 ， 从 而 令 市 场 更 偏向 于 短期 的 结果 。 

另 一 方面 ， 某 些 投资 者 还 会 提前 离 场 ， 原 因 之 一 就 是 很 多 交易 员 甚 少 考虑 长 
期 从 事 这 一 工作 一 一 现在 的 常态 甚至 变 成 了 有 些 年 轻 人 不 会 在 同一 个 企业 中 就 职 
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五 年 以 上 ! 如 果 要 获得 据 升 ， 一般 来 说 需要 在 儿 年 内 获得 辉煌 的 成 绩 ， 那 就 不 妨 
下 重 本 并 承担 短期 的 风险 。 

这 两 个 效应 ， 再 加 上 其 他 我 没有 想到 的 效应 ， 大 大 损害 了 市 场 的 预测 能 力 。 
一 般 来 说 ， 这 些 效应 就 是 金融 泡沫 的 成 因 。 














金融 泡沫 


我 们 先 从 荷兰 谈 起 。 在 17 世纪 初 ， 郁 金 香 成 为 红 极 一 时 的 佳品 。 当 时 的 荷兰 
人 纷纷 抢购 郁金香 的 球茎 ， 需 求 迅 速 膨胀 ， 但 供给 却 没 有 增长 ， 这 就 导致 了 郁 金 
香 球茎 的 价格 迅速 上 升 。 实 际 上 ， 这 种 价格 上 升 似乎 无 法 避免 ,因为 优秀 的 投资 
者 以 非常 高 的 价格 购买 了 大 量 郁金香 球茎 ， 然 后 以 更 高 的 价格 将 其 卖 出 。 这 些 投 
资 者 获得 了 大 量 财富 ， 成 为 金融 市 场 的 大 玩家 。1635 年 ， 对 于 郁金香 的 狗 狂 追捧 
达到 了 一 株 郁 金 香 的 价格 能 买 下 一 座 庄园 的 程度 。 这 就 是 所 谓 的 “郁金香 狂热 "。 

但 在 1637 年 ， 郁 金 香 的 价格 突然 停止 上 升 。 投 资 郁金香 球茎 的 人 开始 害怕 存 
货 的 价格 会 下 跌 ， 于 是 不 惜 亏本 也 要 将 其 卖 出 ， 这 就 让 价格 开始 下 跌 。 但 价格 下 
跌 得 越 厉 害 ， 和 希望 尽快 卖 出 存货 的 投资 者 就 越 多 ， 价 格 因此 继续 下 降 。 更 可 怕 的 
是 ， 价 格 越 低 ， 买 家 就 越 希 望 等 待 价格 继续 下 跌 ， 因 此 存货 越 来 越 难 找到 买 家 ， 
而 卖家 就 必须 继续 下 调 出 售 的 价格 。 这 就 是 投机 泡沫 的 破灭 过 程 I, 

在 人 类 历史 上 ， 这 种 情形 远 非 绝无仅有 。2008 年 ， 所 谓 的 “次 贷 危 机 ”严重 
冲击 了 美国 的 信用 市 场 ， 后 果 席 卷 全 球 。 这 场 危机 的 起 点 是 美国 不 动产 市 场 投机 
泡沫 的 破裂 。 在 次 贷 危 机 之 前 ,许多 美国 人 不 习 于 通过 借贷 来 购 入 住宅 ， 因 为 他 
们 预计 住宅 上 涨 后 的 价值 足以 填补 大 部 分 贷款 。 随 着 越 来 越 多 美国 人 和 银行 相信 
不 动产 价格 会 继续 上 升 ， 人 们 越 来 越 乐 于 购买 住宅 ， 而 不 动产 的 价格 也 因此 不 断 
上 升 ， 购 买 考 也 更 乐意 贷款 购买 住宅 。 

然而 ,一 旦 不 动产 价格 停止 上 升 ， 利 用 上 涨 后 的 价值 来 填补 贷款 的 策略 就 受 
到 了 考验 。 越 来 越 多 的 家 庭 无 法 偿付 贷款 ， 必 须 出 售 他 们 的 住宅 。 但 出 售 住宅 的 
人 越 多 ， 住 宅 的 价格 也 就 下 降 得 越 厉害 ， 无 法 偿付 贷款 的 人 就 越 多 。 这 个 恶性 循 
环 放大 了 这 一 现象 。 
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更 不 妙 的 是 ， 银 行 贷 款 变 成 了 复杂 的 衍生 产品 ， 被 出 售 给 华尔街 的 投资 者 ， 

但 投资 者 没有 预见 到 这 一 切 。 就 是 这 样 ， 大 量 美国 公民 的 债务 违约 变 成 了 大 型 投 
资 机 构 的 金融 无 底 洞 ， 这 些 投资 机 构 的 垮台 导致 大 量 企 业 倒闭 。 这 就 变 成 了 全 球 
性 的 灾难 M, 
在 这 里 ， 我 们 看 到 了 市 场 预测 能 力 的 根本 极限 。 新 投资 者 的 经 常 性 流入 、 其 
他 投资 者 的 经 常 性 流出 ， 都 会 使 市 场 动态 与 贝 叶 斯 公式 产生 分 歧 。 尤 其 是 市 场 的 
这 些 特 性 使 其 更 加 短视 。 这 就 是 行动 较 缓慢 的 政策 与 投机 泡沫 之 间 不 兼容 的 地 方 。 
用 统计 学 的 术语 来 说 ， 市 场 的 高 速度 必然 导致 对 近期 历史 的 过 度 解读 。 这 就 是 市 
场 长 期 预测 的 置信 度 远 远 不 如 科学 共识 的 原因 。 



























































对 技术 史 的 分 析 证 明了 技术 的 进步 是 指数 式 
的 ， 这 与 对 应 着 “线性 直觉 ”的 一 般 常 识 正 
好 相反 。 因 此 ， 我 们 在 21 世纪 将 不 只 体验 
到 100 年 的 进步 ， 而 可 能 是 大 约 20 000 年 的 
进步 ( 以 今天 的 节奏 计算 )。 

雷 . 库 效 韦 尔 (1948 一 ) 


#lls 


指数 超 乎 直觉 


那些 大 得 过 分 的 数 





“线性 增长 就 是 1、2、3， 指 数 增长 就 是 1、2、4。 它 们 好 像 没 什么 不 同 。 
(m ) 但 在 第 30 步 时 ， 线 性 增长 只 达到 30， 我 们 的 直觉 也 是 这 样 的 ， 而 指数 增 
长 已 经 达到 了 10 亿 。” 未 来 学 家 雷 ' 库 兹 韦 尔 这 样 说 道 ,“ 我 们 的 直觉 是 线性 的 ， 
但 信息 技术 的 现实 是 指数 式 的 ， 这 个 差异 相当 深刻 。” 

对 于 库 兹 韦 尔 来 说 ， 我 们 对 指数 增长 的 错误 认识 在 短期 内 可 能 会 导致 我 们 稍微 
低估 新 技术 的 影响 ， 但 在 五 年 以 上 的 长 期 视角 下 则 毫 无 疑问 会 导致 对 其 严重 的 低估 。 
但 在 讨论 这 一 点 之 前 ， 我 们 最 好 先 体验 一 下 极其 巨大 的 数字 可 以 有 多 大 。 

我 们 先 从 看 起 来 很 合理 的 数字 开始 。100 万 这 个 数字 在 日 常生 活 中 频繁 出 现 ， 
以 至 于 我 们 会 觉得 人 们 应 该 理解 了 这 个 数 有 多 大 。2016 年 11 月 ，Dr Nozman 成 为 
第 一 位 订阅 数 超过 100 万 门槛 的 法 语 网 络 视频 科学 主播 。 足 球 运 动员 的 年 薪 可 以 
用 百 万 欧元 来 计量 , 一些 国家 的 人 口 通常 也 以 百 万 量 级 来 衡量 。 
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然而 ， 我 们 不 能 将 对 这 个 数字 的 熟悉 程度 等 同 于 对 它 的 理解 。100 万 是 个 很 大 
的 数字 。 一 个 人 即使 能 达到 一 秒 数 一 个 数字 的 速度 ， 每 天 数 8 小 时 ， 也 很 难 在 一 
个 月 内 数 到 100 万 ?。100 万 是 一 个 我 们 可 以 想象 的 数字 ,但 从 0 开始 向 它 步 步 迈 进 
却 无 法 企及 。 

但 在 真正 巨大 的 数字 面前 ，100 万 只 相当 于 一 粒 细 沙 。10 亿 就 已 经 比 它 大 得 多 
T! 那些 最 富有 的 人 的 年 收入 以 十 亿 欧 元 计 ， 这 可 是 我 的 年 薪 的 1 万 倍 ! 为 了 理解 这 
个 数字 多 么 巨大 ， 我 们 可 以 强调 这 一 事实 : 按照 比例 ， 我 手 上 的 1 欧元 就 相当 于 这 些 
亿 万 富翁 手 上 的 1 万 欧元 。 这 样 一 来 ， 就 像 我 不 会 花 时 间 在 路 上 擒 起 1 欧元 的 硬币 一 
样 ， 那 些 亿 万 富翁 在 面 对 别 人 给 予 的 价值 1 万 欧元 的 资产 时 也 不 会 为 此 动 一 根 小 指头 。 

我 们 也 可 以 换 一 种 看 法 。 一 些 研究 表明 ， 只 要 年 收入 超过 7 万 欧元 ， 金 钱 就 
不 再 能 够 带 来 幸福 。 或 者 说 ， 某 个 年 收入 超过 7 万 欧元 的 人 在 统计 意义 上 不 会 比 
年 收入 恰好 为 7 万 欧元 的 人 更 幸福 止 。 现 在 想象 一 下 ， 一 位 亿 万 富翁 知道 了 这 一 

i， 决 定 每 年 要 恰好 花费 7 万 欧元 。10 亿 欧 元 就 足够 他 无 须 工 作 过 上 1.4 万 年 ! 
换个 说 法 ， 如 果 他 每 年 收入 10 亿 欧 元 ， 就 足以 保证 让 1.4 万 人 获得 足以 达到 幸福 
最 大 值 的 财产 一 一 其 中 也 包括 他 自己 ! 

但 在 物理 学 的 尺度 上 ，10 亿 只 能 算是 个 小 得 可 怜 的 数值 。 我 们 的 银河 系 包 含 
千 亿 颗 恒 星 ， 我 们 的 大 脑 是 由 千 万 亿 个 神经 元 连接 构成 的 ， 我 们 这 个 地 球 包含 数 
百 亿 亿 颗 沙砾 ， 而 一 滴水 则 是 一 亿 亿 亿 个 分 子 组 成 的 集合 体 。 面 对 如 此 庞大 的 数 

人 们 更 喜欢 用 类 似 102 这 样 的 记号 ， 它 表达 的 是 1 后 面 接 上 24 个 0 的 数字 。 
这 些 数字 是 字面 意义 上 的 天 文 数字 。 

但 这 些 数字 也 就 局 限于 是 天 文 数字 了 。 即 使 现代 物理 学 让 我 们 遇见 了 更 大 的 
数字 ,用 10 的 次 方 就 足以 表达 物理 上 的 各 种 极限 。 比 如 说 ， 根 据 某 些 现代 物理 学 
理论 ， 时 间 是 离散 的 ， 它 流逝 的 单位 是 普 朗 克 时 间 ， 大 约 是 10-5 秒 。 这 样 的 话 ， 
宇宙 大 爆炸 以 来 只 经 过 了 约 109 个 基本 时 间 单 位 。 此 外 ,在 整个 可 观测 宇宙 中 的 
原子 只 有 大 约 1099 个 口 。 



































































































































四 ”原文 的 时 间 是 一 年 ,但 一 天 有 86 400 秒 ， 一 年 共有 超过 3000 万 秒 ， 一 秒 数 一 个 数字 ， 数 到 
100 万 绰 绒 有 余 。 但 一 个 月 只 有 约 250 万 秒 ， 实 际 上 需要 每 天 数 约 9.26 小 时 ， 才 能 在 一 个 月 
内 数 完 100 万 个 数 。 一 一 译 者 注 
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计算 的 “玻璃 天 花 板 ” 


物理 上 的 限制 必然 会 转化 为 我 们 的 计算 能 力 的 上 限 。 在 今天 ， 计算 机 科学 家 
通常 认为 需要 超过 10” 个 计算 步骤 的 算法 在 人 类 历史 内 不 可 能 完成 ， 毕 竟 这 个 计 
算 步 又 的 上 限 要 远大 于 自 大 爆炸 以 来 经 过 的 时 间 单 位 数 。 

这 个 数字 也 可 以 从 其 他 物理 假设 推导 出 来 。 根 据 爱 因 斯 坦 的 质 能 关系 与 海 森 
堡 不 确定 性 原理 推导 出 来 的 布雷 默 曼 极 限 〈 Bremermann' s limit) 表明 O, 在 物质 宇 
宙 的 某 个 封闭 体系 中 ， 每 单位 质量 的 物质 可 以 提供 的 计算 速度 是 有 限 的 ， 而 这 个 
限制 就 是 每 1 千克 物质 至 多 提供 约 1.36x 107 比特 每 秒 的 计算 。 但 整个 地 球 的 物质 
总 量 是 有 限 的， 大 约 是 6x102# 千克 。 因 此 ， 即 使 用 上 整个 地 球 的 物质 总 量 ， 计 算 
的 速度 也 无 法 超过 Ax107 比特 每 秒 。 也 就 是 说 ， 如 果 进 行 10% 次 计算 ， 那么 用 上 
整个 地 球 的 物质 总 量 也 至 少 需要 数 百 万 年 。 

这 个 计算 的 “玻璃 天 花 板 ”的 假设 ， 正 是 密码 学 家 赖 以 保证 通信 安全 的 原则 。 
密码 学 家 假设 ， 现 实 中 用 到 的 密码 协议 必须 需要 超过 10% 个 计算 步 又 才能 破译 。 
如 果 做 到 了 这 一 点 ， 那 就 意味 着 在 今天 利用 这 些 技 术 加 密 的 信息 不 仅 在 明天 无 法 
被 破译 ， 甚 至 在 从 今 往 后 的 数 百 万 年 间 都 不 可 能 被 地 球 上 的 人 类 破译 ， 由 此 保证 
了 被 加 密 数 据 的 绝对 安全 。 

当然 ， 通 过 收买 特定 的 人 员 或 者 他 们 的 知识 ， 还 是 有 可 能 破译 这 些 加 密 数 据 
的 ， 而 所 谓 的 “社会 工程 学 ”技术 通常 也 是 计算 机 安全 问题 出 现 的 主要 原因 。 更 
糟 的 是 ， 我 们 仍然 不 大 了 解 算法 的 能 力 ， 目 前 无 法 确定 是 否 存在 能 够 绕 过 蜜 但 学 
家 认为 必 不 可 少 的 10” 次 运算 的 算法 。 这 个 问题 其 至 涉及 所 请 的 “P 对 NP” 问 
题 ， 它 是 理论 计算 机 科学 中 最 重要 的 未 解 问题 。 实 际 上 ， 自 1997 年 彼得 HAN 
的 发 现 以 来 ,我 们 甚至 知道 ， 如 果 能 够 建造 出 拥有 足够 大 的 量子 内 存 空 间 的 量子 















































HT 

















































































































D 关于 计算 的 物理 极限 ， 原 书 采用 的 是 兰 道 尔 原则 (Landauer’s principle )， 它 来 自 玻 尔 效 曼 方 
程 ， 给 出 了 不 可 逆 的 比特 运算 最 少 需要 的 能 量 。 根 据 太阳 系 总 能 量 的 估算 ， 可 以 得 出 整个 太 
阳 系 至 多 可 以 进行 多 少 次 不 可 道 的 比特 运算 。 但 计算 不 一 定 只 能 在 不 可 逆 的 情况 下 进行 ， 所 
谓 的 “绝热 量子 计算 ”就 是 一 种 可 逆 的 计算 方式 ， 从 而 不 受 兰 道 尔 原则 的 限制 。 经 过 与 原 书 
作者 的 沟通 ， 此 处 改 为 适用 范围 更 广 的 布雷 默 曼 极限 ， 下 文中 的 数字 也 做 出 了 相应 的 修 
改 。 一 一 译 者 注 
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计算 机 ， 那么 就 可 以 利用 量子 算法 来 破译 目前 使 用 的 众多 密码 协议 ， 其 中 也 包括 
RSA 加 密 算法 。 

现在 我 们 来 详细 叙述 一 下 RSA 加 密 算法 ， 它 是 所 谓 的 非 对 称 加 密 ， 也 就 是 
说 ，RSA 的 使 用 者 拥有 两 个 协同 使 用 的 密 钥 : AH e 和 私 钥 d。 重 要 的 是 ， 给 定 公 
钥 e， 用 户 可 以 先 秘密 选取 两 个 足够 大 的 素数 p 和 4g， 然后 迅速 计算 出 与 公 钥 e 对 
应 的 私 钥 da。 然而 ,为 了 让 其 他 人 能 够 向 自己 发 送 加 密 信息 ， 用 户 应 该 同时 披露 
这 两 个 素数 的 乘积 N =pqg。 这 样 的 话 ， 如 果 攻 击 者 能 够 将 分解 为 两 个 素数 p 和 
q 的 乘积 的 话 ， 他 就 可 以 按照 用 户 执行 过 的 步 又， 根据 公 钥 e 迅速 计算 出 私 钥 d, 
这 样 他 就 破译 了 RSA 加 密 算 法 。 

因此 ，RSA 的 安全 性 完全 依赖 于 这 样 的 假设 : 没有 人 能 够 将 整数 Y 分 解 为 素 
数 的 乘积 。 这 就 是 所 谓 的 整数 分 解 问题 。 目 前 来 说 ， 我 们 仍然 不 知道 是 否 存 在 某 种 
快速 的 (经 典 ) 整数 分 解 算法 。 对 于 RSA 的 安全 性 来 说 ， 因 为 没有 不 存在 性 的 证 
明 ， 我 们 只 能 祈 望 没有 人 会 找到 这 样 的 算法 。 很 不 巧 的 是 ， 肖 尔 的 量子 算法 能 够 迅 
速 解决 整数 分 解 问题 ， 而 且 真正 意义 上 的 量子 计算 机 面世 似乎 只 是 时 间 问 题 了 .…… 

整数 分 解 问题 的 难度 也 许 看 似 惊 人 。 我 们 可 能 会 觉得 ， 只 要 尝试 将 N 除 以 任 
何 比 它 小 的 数 a 就 足够 了 。 我 们 甚至 可 以 证 明 只 需要 对 2 和 VN 之 间 的 所 有 整数 
进行 试 除 。 然 而 在 现实 中 用 到 的 N 巨 大 无 比 ,一般 来 说 在 10 这 个 量 级 。 需 要 
进行 试 除 的 数 大 概 有 VN 个 ， 在 这 里 大 概 就 是 10'”。 然 而 我 们 之 前 看 到 ， 可 以 将 
10? 看 作物 质 世 界 中 能 够 进行 的 运算 次 数 的 上 限 ， 而 105^ 远 远 超出 了 这 一 上 限 。 































































































指数 爆炸 





所 有 计算 的 “玻璃 天 花 板 ”似乎 是 一 个 无 法 达到 的 极限 。 这 是 因为 对 于 线性 
增长 来 说 ， 它 是 在 物理 学 意义 上 无 法 企及 的 。 然 而 非常 违反 直觉 的 是 ， 惊 人 的 指 
数 增长 实际 上 很 快 就 能 达到 这 个 数量 级 。 




















O 更 准确 地 说 ， 用 户 应 该 计算 出 满足 ed =1 mod (p-1)(g-1) 的 & 值 ， 可 以 利用 欧 几 里 得 算法 对 
e 和 -DCG-D 的 最 大 公约 数 的 计算 得 到 。 我 在 这 里 省 略 了 一 些 细节 。 
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传说 ”古代 印度 某 位 国王 很 喜欢 一 位 智者 向 他 呈献 的 国际 象棋 游戏 , 于 是 他 让 
智者 自己 选择 想 要 的 报酬 。 智 者 谦 皇 地 回答 道 ， 只 要 第 一 天 在 棋盘 第 一 格 中 放 1 
粒 米 ， 第 二 天 在 下 一 格 中 放 2 粒 米 ， 然 后 在 下 一 格 中 放 4 粒 ， 接 下 来 放 8 粒 ， 等 
等 ， 放 满 棋 盘 之 后 他 就 满足 了 。 国 王 惊异 于 这 个 微小 的 要 求 ， 于 是 就 接受 了 。 这 
是 个 严重 的 错误 ! 在 64 天 以 后 ， 国 王 就 从 下 了 几 百 亿 亿 粒 米 的 债务 ， 这 大 概 是 今 
天 全 世界 称 米 年 产量 的 1000 倍 ! 可 以 说 国王 向 智者 欠 下 了 永恒 的 债务 FL 
国王 欠 下 呈 指 数 增长 的 债务 有 些 出 人 意料 。 同 样 ， 只 需 将 一 张 纸 对 折 42 次 ， 
其 厚度 就 会 达到 地 球 和 月 球 之 间 的 距离 ;对折 103 次 的 话 ， 其 厚度 就 会 达到 可 观 
测 宇宙 的 直径 ! 然而 ， 可 观测 宇宙 非常 非常 大 ， 直 径 几 乎 有 1 亿 亿 亿 千 米 ! 而 且 ， 
只 需 103 次 ， 指 数 增长 就 能 超越 天 体 物 理学 的 极限 ! 

我 们 在 谱系 图 中 也 能 发 现 这 种 疯狂 的 增长 。 这 是 因为 我 们 每 个 人 都 是 (生物 
学 意义 上 ) 双亲 的 后 代 ， 所 以 在 回溯 历史 时 ， 祖 先 的 数目 会 呈 指 数 增长 。 通 过 计 
算 机 模拟 ， 在 考虑 过 往 文明 在 地 理 位 置 上 的 迁移 后 ， 罗 德 、 奥 尔 森 和 张 (音译 ) 
估计 外 ,目前 存活 的 所 有 人 都 有 同一 个 生活 在 2000 到 5000 年 前 的 祖先 2 。 的 确 ， 
我 们 每 个 人 都 是 几 百 等 的 血亲 ! 不 仅 如 此 ， 活 在 这 位 最 近期 共同 祖先 之 前 的 人 类 ， 
要 么 就 是 目前 存活 的 所 有 人 的 祖先 ， 要 么 就 不 是 我 们 之 中 任何 人 的 祖先 加 ! 

同样 ， 在 学 术 界 中 ， 人 们 常 说 博士 导师 就 是 学 术 父 母 ， 而 我 们 的 学 术 父母 的 
学 术 父 母 就 是 我 们 的 学 术 祖辈 。 更 进一步 的 话 ， 我 们 可 以 回溯 学 术 族谱 ， 发 掘 出 
我 们 的 学 术 祖先 。 就 像 米 卡 埃 尔 ' 洛 奈 是 哈代 、 艾 萨 克 ' 牛顿 和 伽利略 的 学 术 后 
代 那 样 ， 我 则 是 乔治 . 丹 齐 格 、 卡 尔 . 弗 里 德里 希 * 高 斯 和 莱 昂 哈 德 ， 欧 拉 的 学 
术 后 代 。 我 甚至 发 现 自己 的 学 术 祖 先 包括 耶 日 内 曼 ，( 我 们 可 没 法 选择 自己 的 祖 
先 ! ) 还 有 皮 埃 尔 -西蒙 拉 普 拉 斯 。( 我 为 此 感到 非 理 性 的 骄傲 ! ) 但 是 在 我 们 的 
学 术 族 谱 中 出 现 这 些 名 人 并 不 令 人 意外 ， 一 来 ， 数 世纪 前 的 数学 家 并 不 多 ， 二 来 ， 
由 于 某 些 人 有 多 个 学 术 父 母 ， 所 以 学 术 祖先 的 数目 也 会 指数 增长 。 
























































































































































中 ”这 一 传说 中 的 出 场 人 物 姓名 不 可 考 ， 而 且 有 多 个 版 本 。 作 者 给 出 的 国王 名 字 是 Belkib， 而 智 
者 的 名 字 则 是 Sessa。 为 免 误 会 ， 此 处 删 去 具体 名 字 ， 仅 仅 以 “国王 ”和 “智者 ”称呼 两 位 角 

色 。 一 一 译 者 注 

© 不 能 将 最 近 共 同 祖先 与 其 他 概念 混同 起 来 ， 比 如 “所 有 母亲 的 母亲 ”线粒体 夏娃 。 因 为 母系 
族谱 不 会 呈 指 数 增长 ， 所 以 线粒体 夏娃 必定 更 为 久远 。 
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如 果 说 指数 增长 令 人 目瞪口呆 ,那么 指数 下 降 也 一 样 。 将 一 颗 糖 对 半分 开 ， 
重复 六 十 几 次 后 ， 就 必须 切 开 糖 的 分 子 才能 对 半分 开 。 同 样 ， 顺 势 疗 法 一 般 会 将 
有 效 成 分 的 浓度 稀释 成 之 前 的 百 分 之 一 。 这 样 的 话 ， 即 使 一 开始 有 效 成 分 的 分 子 
数目 是 个 天 文 数字 ， 只 需 12 次 稀释 就 能 在 统计 意义 上 保证 其 中 不 再 含有 任何 有 效 
成 分 的 分 子 ! 这 产生 于 分 子 浓度 在 一 次 又 一 次 的 稀释 中 的 指数 下 降 。 

对 很 多 人 来 说 ， 生 物 从 (几乎 ) 什么 都 没有 到 涌现 出 如 此 的 复杂 度 似乎 并 不 
现实 。 但 人 们 无 法 理解 自然 选择 如 何 使 不 同 物种 达到 现在 的 复杂 度 ， 这 可 能 与 我 
们 对 地 界 的 线性 直觉 有 关 。 正 如 我 们 在 讲解 洛 特 卡 — 沃 尔 泰 拉 方 程 时 看 到 的 那样 ， 
生物 本 身 会 繁衍 。 在 有 丝 分 裂 中 ， 一 个 细胞 会 分 裂 成 两 个 细胞 ， 而 其 中 每 个 后 代 细 
胞 又 会 各 自分 裂 成 另外 两 个 细胞 ， 以 此 类 推 。 在 每 一 步 中 ， 细 胞 的 总 数 会 乘 以 2。 
这 样 的 话 ， 在 几 天 到 几 个 月 的 时 间 内 ， 一 个 单独 的 卵细胞 可 以 变 成 一 个 复杂 的 生 
命 体 ， 其 中 包含 数 万 亿 个 细胞 。 

当然 ， 变 异 和 自然 选择 导致 的 生命 体 复 杂 度 的 指数 增加 更 “缓慢 "， 特 别 是 与 
技术 进步 相 比 。 然 而 ， 演 化 发 生 在 我 们 无 法 想象 的 漫长 时 间 之 中 ,大概 有 数 亿 年 
之 久 。 正 因 如 此 ， 虽说 在 世纪 的 尺度 上 演化 不 会 产生 很 多 可 觉察 的 变化 ， 但 我 们 
必须 意识 到 ， 自 第 一 个 活 细胞 出 现 以 来 已 经 过 了 数 千 万 个 世纪 。 这 些 巨 大 的 数量 
已 经 超出 了 我 们 的 理解 能 力 ， 如 此 长 的 一 段 时 间 内 的 指数 增长 就 更 不 用 说 了 ! 

在 没有 数学 模型 的 情况 下 断言 达尔 文 式 演化 没有 足够 的 时 间 创 造 出 生命 的 复 
杂 性 ， 其 实 就 是 依靠 自身 对 于 大 数 以 及 指数 增长 的 直觉 来 得 出 结论 。 因 为 这 种 直 
觉 本 质 上 是 错误 的 ， 所 以 不 值得 我 们 相信 ， 而 且 由 此 而 来 的 结论 同样 不 可 靠 。 

男 一 个 例子 也 能 帮助 我 们 理解 这 一 点 。 目 前 世界 总 人 口 每 年 增长 1.1%。 这 样 
的 增长 难以 忽视 ， 但 似乎 也 并 非 毫 不 合理 。 但 是 ， 简 单 的 计算 四 表明 ， 如 果 按 照 
这 个 增长 率 ,， 在 8604 年 后 ， 世 界 总 人 口 就 会 增长 到 这 个 程度 : 组 成 所 有 人 类 个 体 
的 粒子 数目 会 超过 宇宙 中 所 有 粒子 的 总 数 ! 指数 增长 可 能 在 非常 短 的 时 间 内 难以 
察觉 ， 却 能 在 一 段 不 太 长 的 时 间 内 侵占 整个 宇宙 。 

但 反 过 来 说 ， 只 要 每 位 妇女 生育 孩子 的 数目 小 于 2(〈 这 是 许多 发 达 国家 的 情 
况 )， 那 么 宇宙 历史 上 人 类 的 个 体 总 数 就 会 受到 惊人 的 限制 ! 如 果 每 位 妇女 平均 有 
1.9 个 孩子 ， 那 么 无 论 年 龄 如 何 ， 从 过 去 到 未 来 的 全 人 类 的 个 体 总 数 就 会 只 处 于 数 
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千 亿 这 个 数量 级 。 这 样 的 话 ， 即 使 生物 学 家 成 功 让 我 们 得 以 永生 ， 人 口 过 多 也 只 
会 是 个 暂时 性 的 问题 1 

要 感受 指数 增长 的 疯狂 ， 我 强烈 建议 你 去 玩 一 个 叫 作 《通用 回形针 》 
(Universal Paperclips ) 的 在 线 游戏 。 但 要 小 心 ， 这 个 游戏 很 容易 上 疗 。 它 展示 了 
博 斯 特 罗 姆 叙述 的 一 个 寓言 。 一 个 人 工 智 能 尝试 最 大 化 回形针 产量 ,为 了 达到 这 
个 目的 ， 它 大 举 投 资 科 研 ， 加 速 推 进 技术 的 进步 。 人工 智能 在 技术 上 越 进 步 ， 发 
展 就 越 快 ， 但 这 一 增长 是 指数 式 的 ， 而 且 毫 无 节制 。 在 仅仅 玩 了 两 天 之 后 ,《 通 用 
回形针 》 就 将 我 们 从 每 次 只 能 生产 一 个 回形针 的 开端 带 到 征服 并 占领 整个 宇宙 这 
个 不 可 避免 的 结局 。 



















































































印度 - 阿拉 伯 数 字 的 魔法 


我 们 回 到 密码 学 。 我 们 之 前 看 到 ， 密 码 学 家 经 常用 到 105 这 个 数量 级 的 整数 
N， 这 样 的 整数 非常 大 ， 即 使 是 VN 步 的 计算 也 会 超出 物理 上 的 限制 。 我 们 是 如 何 
能 够 谈 及 这 种 超出 物理 极限 的 大 数 的 呢 ? 

人 类 历史 上 的 许多 伟大 帝国 ， 比 如 古 埃 及 帝国 和 古 罗 马 帝 国 ， 在 很 长 一 段 时 间 内 
都 只 用 一 种 非常 低 效 的 方式 来 表示 各 种 数字 。 比 如 说 ，1888 这 个 数 写成 罗马 数字 就 是 
MDCCCLXXXVII。 此 外 ， 古 罗马 人 在 发 明 新 符号 表达 越 来 越 大 的 数字 这 一 方面 上 有 
着 种 种 限制 ， 甚 至 无 法 写 出 类 似 100 万 那样 的 数字 一 一 除非 把 1000 个 M 排 成 一 排 ! 

但 是 ,古巴 比 伦 人 、 中 国人 、 日 本 人 ,尤其 是 古代 的 印度 人 和 阿拉 伯 人 有 了 
一 个 聪明 的 想法 ， 那 就 是 位 值 制 计数 法 。 这 种 计数 法 最 大 的 特点 就 是 符号 的 位 置 
决定 了 它 的 数值 。 这 样 的 话 ， 正 如 我 们 都 知道 的 那样 ， 即 使 12 和 21 用 到 的 符号 
完全 相同 ， 但 它们 是 不 同 的 数字 。 

我 就 不 描述 印度 - 阿拉 伯 数 字体 系 是 如 何 运 作 的 了 ， 你 应 该 在 小 时 候 就 学 过 。 
但 是 ， 你 可 能 没有 注意 到 一 点 ， 这 种 计数 法 具有 出 众 的 简洁 性 。 即 使 它 只 用 到 有 
限 个 符号 〈 又 叫 数字 )， 表 达 某 个 数值 需要 的 数字 个 数 要 比 数值 本 身 小 得 多 。 比 如 
说 10" 这 个 超出 了 物理 限制 的 数 ， 但 我 们 的 计数 法 是 如 此 高 效 ， 只 需要 101 个 数 
字 就 可 以 将 它 表 示 出 来 一 一 一 个 1 后 面 跟着 100 个 0。 
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在 某 种 意义 上 ， 这 种 计数 系统 甚至 是 最 优 的 。 这 是 因为 要 表达 从 0 到 10%-1 
的 所 有 数 ， 这 几乎 就 是 最 简洁 的 方式 了 。 毕 竟 100 个 数字 的 所 有 可 能 组 合 都 用 上 
了 。 实 际 上 ， 某 个 数 的 大 小 是 用 数字 表达 它 所 需 长 度 的 指数 函数 。 换 句 话 说， 任 
意 整数 x 差不多 是 10 的 x 的 数字 个 数 那么 多 次 方 。 另 一 种 等 价 的 说 法 是 ， 某 个 数 
的 数字 表达 的 长 度 是 对 数 级 别 的 。 某 个 数 的 对 数 大 概 就 是 要 表达 这 个 数 所 需 的 数 
字 个 数 ， 比 如 说 log,,(10!0=100。 

与 指数 增长 相反 ， 对 数 增长 慢 得 难以 置信 。 例 如 ， 在 已 经 排 好 序 的 数组 中 寻找 某 
个 元 素 所 需 的 时 间 就 是 数组 长 度 的 对 数 。 也 就 是 说 ， 即 使 需要 处 理 的 数组 跟 宇宙 一 样 
大 ， 人 们 也 可 以 在 几 百 次 迭代 后 找到 所 需 的 元 素 一 一 唯一 的 限制 就 是 光速 是 有 限 的 ! 

这 一 发 现 正 是 计算 机 科学 中 最 根本 的 概念 的 核心 ， 这 个 概念 就 是 地 址 。 想 象 
一 下 ， 你 现在 想 在 网 上 找到 某 项 信息 。 令 人 惊异 的 是 ， 尽 管 网 上 的 信息 需要 以 EB 
(1055515) 甚至 ZB CIO? 字 节 ) 来 计量 , 但 只 要 有 了 你 想 要 搜寻 的 信息 的 地 址 ， 
也 就 是 它 的 统一 资源 定位 器 ( Uniform Resource Locator， 以 下 简称 URL )， 那 么 你 
可 以 几乎 瞬间 就 找到 想 要 的 信息 ! 

此 外 ,信息 的 URL 简短 得 难以 置信 。 它 的 长 度 是 整个 网 络 大 小 的 对 数 ! 因此 
我 们 可 以 将 整个 URL 放 在 内 存 中 ， 而 URL 指向 的 信息 就 不 一 定 了 外。 之 后 我 们 
在 谈 到 实用 贝 叶 斯 主义 者 对 记忆 储存 的 管理 时 也 会 再 次 提 到 地 址 这 个 基本 概念 。 

更 准确 地 说 ， 对 数 与 指数 一 样 ， 都 依赖 于 一 个 被 称 为 基数 的 参数 。1、2、4 这 
个 数列 是 基数 为 2 的 指数 递增 数列 ， 这 是 因为 在 每 一 步 中 ， 我 们 都 将 数列 中 的 元 
素 乘 以 2 来 得 到 下 一 个 元 素 。 换 句 话说， 数列 中 的 第 n+l 项 可 以 写成 2"。 反 过 来 
说 , x 的 以 2 为 底 的 对 数 就 是 要 得 到 x 从 1 开始 乘 以 2 的 次 数 。 因 此 ，log;(27) n, 
因为 2 可 以 通过 2 自 乘 n 次 得 到 。 如 果 x 不 是 2 的 乘 方 ,那么 取 以 2 为 底 的 对 数 
就 是 确定 使 得 2° =x 的 实数 y 的 一 个 自然 而 巧妙 的 方法 。 

































































































































































本 福特 定律 








打开 网 络 上 世界 各 国 依 照 人 口 排序 的 列表 ， 观 察 一 下 这 些 人 口 总 数 的 第 一 个 
数字 ， 你 会 惊讶 地 发 现 一 个 令 人 困惑 的 现象 : 它们 的 首位 数字 通常 更 多 是 1 而 不 是 
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9 ! 这 个 惊人 的 观察 结果 并 不 局 限于 国家 人 口 总 数 。 如 果 观 察 河流 长 度 、YouTube 
频道 订阅 数 或 者 百 万 富翁 的 年 收入 的 话 ， 在 这 些 情况 中 ， 最 常 出 现 的 首位 数字 还 
是 1， 而 且 它 作为 首位 数字 出 现 的 次 数 大 概 是 9 作为 首位 数字 的 6-7 倍 ! 这 就 是 
令 人 吃惊 的 本 福特 定律 PL 

本 福特 定律 的 根源 是 一 项 经 常 在 许多 系统 中 出 现 的 性 质 。 比 如 说 ， 就 像 我 们 
在 第 10 章 谈 到 的 洛 特 卡 - 沃 尔 泰 拉 方 程 那 样 ， 很 多 动力 系统 在 内 部 引发 的 连锁 反 
应 都 可 以 用 指数 增长 来 描述 。 比 如 说 ，YouTube 频道 订阅 数 的 增长 一 般 就 是 指数 
式 的 ， 比 如 说 订阅 数 每 6 个 月 就 会 翻 倍 。 假 设 订 阅 数 在 这 6 个 月 中 在 1000 和 2000 
之 间 ， 那 么 在 接 下 来 的 6 个 月 中 订阅 数 就 会 在 2000 和 4000 之 间 ， 再 过 6 个 月 之 
后 就 会 在 4000 和 8000 之 间 ， 之 后 的 6 个 月 就 会 在 8000 和 16 000 之 间 。 从 这 里 
我 们 就 能 看 到 本 福特 定律 是 怎么 来 的 。 在 6 个 月 的 时 间 中 订阅 数 处 于 1000 和 2000 
之 间 ， 而 处 于 9000 和 10 000 之 间 的 时 间 却 不 足 1 个 月 。 这 也 就 提示 了 为 什么 订阅 
数 的 首位 数字 为 1 的 情况 是 首位 数字 为 9 的 情况 的 6 fi. 

为 了 更 好 地 理解 指数 增长 ， 很 有 必要 更 换 我 们 研究 的 尺度 。 与 其 研究 订阅 数 
本 身 ， 我 们 可 能 更 希望 研究 订阅 数 以 2 为 底 的 对 数 。 我 们 知道 1024=20， 以 及 
2048=20。 这 样 的 话 ， 经 过 6 个 月 后 ， 订 阅 数 以 2 为 底 的 对 数 就 会 从 10 变 成 11， 
再 经 过 6 个 月 就 会 变 成 12， 然 后 是 13， 以 此 类 推 。 你 明白 了 吗 ? 订阅 数 以 2 为 底 
的 对 数 每 6 个 月 就 会 增加 一 个 单位 。 

但 在 我 们 刚刚 构建 的 对 数 尺度 上 ， 订 阅 数 的 对 数 处 于 10 和 11 之 间 的 时 间 等 
于 它 处 于 11 和 12 之 间或 12 和 13 之 间 的 时 间 。 现 在 假设 我 们 观察 的 是 不 同 频道 
的 订阅 数 在 增长 过 程 中 不 同 的 时 刻 。 可 以 预期 的 是 ， 这 些 订 阅 数 的 对 数 处 于 10 和 
11 之 间 的 可 能 性 与 处 于 13 和 14 之 间 的 可 能 性 一 样 。 用 数学 术语 来 说 ， 订 阅 数 的 
对 数 的 分 布 差不多 是 均匀 的 “。0m 这 就 是 本 福特 定律 成 立 的 技术 条 件 : 如 果 某 个 数 
量 的 自然 尺度 是 对 数 尺度 ( 而且 跨 越 了 几 个 数量 级 ) 的 话 ， 那 么 这 一 数量 的 首位 
数字 为 1 的 可 能 性 就 大 约 是 首位 数字 为 9 的 可 能 性 的 6 倍 ?。 

















































































































(D 实际 上 ， 达 维 德 . 卢 阿 普尔 指出 ， 科 学 频道 各 自 订阅 数 的 对 数 差不多 呈正 态 分 布 。 
D ”严格 的 等 式 是 P[ 首 位 数字 -d]-logo(d-1)-logw(d )。 首 位 数字 是 1、2、3、4、5、6、7、8、 
9 的 概率 分 别 是 大 约 30%、18%、13%、10%、8%、7%、6%、5%、5%。 
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对 数 尺度 











对 数 尺度 在 物理 和 化 学 中 比比 丝 是 。 要 等 比例 画 出 太阳 系 几 乎 是 不 可 能 的 ， 
因为 行星 的 大 小 与 它们 之 间 的 距离 相 比 实在 无 比 渺小 ， 而 行星 之 间 的 距离 与 银河 
系 的 大 小 相 比 则 几乎 为 0， 但 银河 系 的 大 小 跟 星系 之 间 的 距离 相 比 就 像 根本 不 存 
在 ， 而 星系 之 间 的 距离 在 次 乏 的 可 观测 宇宙 面前 则 什么 也 不 是 ! 反 过 来 的 话 ， 微 
观 尺 度 、 纳 米 尺 度 甚 至 亚 原 子 尺度 则 跨越 了 多 个 数量 级 ， 因 此 不 可 能 将 组 成 原子 
核 的 质子 和 原子 核 结合 而 成 的 分 子 同 时 表示 出 来 。 要 同时 考虑 所 有 这 些 尺度 的 话 ， 
对 数 尺 度 必 不 可 少 。 
同样 ， 声 音 强 度 、 地 震 震 级 和 溶液 酸碱度 通常 都 以 对 数 尺度 来 衡量 ， 分 别 是 
分 贝 、 里 氏 震 级 和 pH 值 。 这 些 常 用 单位 实际 上 分 别 等 于 (或 改变 符号 之 后 等 于 ) 
气压 变化 幅度 、 地 震波 能 量 与 氧 离子 浓度 的 对 数 。 

这 些 对 数 尺度 也 解释 了 研究 对 象 的 累 乘 性 质 。 我 们 实际 上 非常 熟悉 将 测量 
之 间 的 差异 解释 为 乘法 倍数 的 说 法 ， 在 处 理 许 多 情况 时 都 会 用 到 这 种 方法 。 举 个 
例子 ， 我 们 一 般 会 说 拥有 20 万 名 订阅 者 的 频道 与 拥有 100 万 名 订阅 者 之 间 的 差 
异 要 小 于 20 万 名 订阅 者 与 50 名 订阅 者 之 间 的 差异 。 然 而 ， 这 人 句 话 在 加 法 尺度 上 
毫 无 意义 ， 因 为 在 第 一 个 情况 中 ， 两 者 的 差距 是 80 万 名 订阅 者 ， 而 在 第 二 个 情况 
中 ， 两 者 的 差距 “只 有 ”199 950 名 。 

但 与 之 相反 的 是 ,我 们 的 直觉 却 与 乘法 尺度 一 致 。 的 确 ， 从 20 万 到 100 万， 
只 需 将 订阅 数 乘 以 5; 但 从 50 到 20 万 ， 就 需要 乘 以 4000。 

乘法 尺度 的 意义 实际 上 等 价 于 对 数 尺度 所 揭示 的 东西 。20 万 和 100 万 在 对 数 
尺度 上 的 差距 等 于 log;(1 000 000) -10g,(200 000) 2.3, mi 50 和 20 万 在 同一 个 对 
数 尺度 上 的 差距 则 大 约 等 于 12。 正 因 如 此 ， 对 数 尺度 经 常用 于 表示 和 比较 那些 以 
相 乘 而 不 是 相 加 来 计算 变化 的 对 象 。 

令 人 好 奇 的 是 ， 没 有 受过 数学 教育 的 小 孩子 和 原始 部 落 的 土著 人 对 数字 的 直 
觉 似乎 也 偏向 于 乘法 而 不 是 加 法 。 如 果 有 人 要 求 他 们 将 从 1 到 10 的 数 按 比例 排 
列 ， 他 们 会 将 头 几 个 数字 隔 得 更 开 ， 而 将 最 后 几 个 数字 靠 得 更 近 。 这 很 像 对 数 尺 
BE (图 11.1) 一 一 即使 他 们 的 排列 实际 上 并 不 完全 是 对 数 尺 度 。 
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1 2 34 56 7 8 9 i 2 3456 
图 11.1 加 法 尺度 与 对 数 尺度 








与 之 相反 的 是 ， 所 有 接受 过 数学 教育 的 人 都 会 将 这 些 数 等 距离 排 开 ， 也 就 是 
按照 加 法 尺度 排列 。 我 们 对 于 数 的 直觉 会 受到 学 习 内 容 的 强烈 影响 。 学 校 教 给 我 
们 用 加 法 来 思考 的 方法 ， 让 我 们 学 会 放弃 乘法 的 直觉 。 然 而 ， 加 法 尺度 并 不 比 乘 
法 尺度 (或 者 说 对 数 尺度 ) 更 自然 。 




















对 数 











正如 米 卡 埃 尔 ' 洛 奈 在 他 的 频道 中 做 出 的 详细 解释 那样 ， 加 法 尺度 与 乘法 
尺度 似乎 属于 两 个 不 同 的 直觉 领域 。 一 个 是 加 法 、 减 法 、 算 术 平 均 和 积分 的 领域 ， 
而 另 一 个 则 是 乘法 、 除 法 、 几 何平 均 和 渐 近 等 价 的 领域 ， 后 者 也 是 YouTube 频道 
订阅 数 、 地 震 强度 与 达尔 文 式 演化 所 属 的 领域 。 对 于 雷 “' 库 效 韦 尔 来 说 ， 这 也 是 
技术 进步 所 属 的 领域 ， 而 对 我 们 来 说 ， 它 首先 是 贝 叶 斯 公式 的 领域 ! 

从 数学 的 角度 来 看 ， 这 两 个 领域 并 非 台 无 关联 ， 甚 至 还 有 中 介 机 制 或 翻译 方 
法 连接 着 两 个 领域 。 我 们 已 经 讨论 过 这 些 中 介 机 制 了 ， 那 就 是 对 数 和 指数 函数 。 
旨 数 函数 可 以 将 加 法 领域 的 对 象 转化 为 乘法 领域 的 对 象 。 由 此 ,数量 之 间 的 加 法 
就 会 转变 为 它们 的 指数 函数 之 间 的 乘法 。 反 过 来 ， 对 数 函 数 会 将 乘法 领域 的 对 象 
转化 为 加 法 领域 的 对 象 。 也 就 是 说 ， 对 数 函 数 可 以 将 我 们 不 熟悉 的 那些 对 象 和 运 
算 传递 到 我 们 更 熟悉 的 领域 中 "。 

因为 加 法 比 乘法 简单 ， 所 以 在 计算 器 出 现 之 前 ， 这 些 翻译 方法 在 数值 计算 中 
占据 了 中 心地 位 。 在 几 十 年 以 前 ， 如 果 学 生 和 科研 工作 者 要 将 a 和 尹 相 乘 ， 他 们 
会 先 用 对 数 表 (或 者 对 数 尺 ) 查 出 a P b 的 对 数 ， 然 后 将 这 些 对 数 加 起 来 ， 最 后 再 
利用 反对 数 表 将 加 法 得 到 的 结果 翻译 到 乘法 领域 中 ， 从 而 获得 所 需 的 结果 “。 这 种 
方法 虽然 看 起 来 有 点 累 殉 ， 却 是 当时 快速 、 准 确 地 进行 复杂 乘法 计算 的 最 好 做 法 。 





































































































D 用 符号 来 说 的 话 ， 我 们 有 2 22" x2" LU log(xy) = log(x) + logy)» 
© 也 就 是 说 ， 我 们 计算 的 是 ob = 10 900nem 0) 。 
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同样 ， 因 为 加 法 比 乘法 简单 ， 所 以 艾 伦 ' 图 灵 在 战争 时 期 曾经 用 对 数 来 进行 
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与 贝 中 























斯 公式 相关 的 计算 。 将 贝 叶 斯 概率 翻译 到 加 法 尺度 上 得 到 的 加 法 单元 (大 











TE) 就 是 图 灵 所 说 的 “ 班 伯 里 单位 "”, 而 正如 我 们 之 后 会 看 到 的 那样 , 它 与 香农 的 
著名 单位 “比特 ”有 着 密切 联系 一 一 也 因此 与 箭 和 KL 散 度 等 概念 有 关 。 
现在 ,我 们 写 出 在 对 数 尺度 下 的 贝 叶 斯 公式 : 

















log P[7]D] -log P[D|T]+log P[7] - log IPLD] 














通常 人 工 知 能 研究 者 更 喜欢 使 用 这 个 版 本 的 贝 叶 斯 公式 ， 而 它 在 统计 物理 以 及 认 
知 科学 中 也 有 众多 应 用 。 





贝 叶 斯 公式 抢 到 了 哥 德 尔 奖 














但 计算 机 科学 家 也 只 是 最 近 才 理解 应 该 如 何 利用 疯狂 的 指数 增长 。2012 4E, 
阿 罗 拉 、 哈 赞 与 卡 莱 发 表 了 一 篇 引 人 注 目的 论文 里 ， 将 众多 不 一 致 但 相似 的 概念 
整合 并 统一 成 了 一 个 简洁 高 效 得 难以 理解 的 算法 。 这 个 算法 就 是 积 性 权重 更 新 算 
ik ( multiplicative weights update method )。 在 这 里 最 重要 的 修饰 语 当然 是 “ 积 性 ”。 
这 个 算法 的 精髓 在 于 利用 乘法 尺度 来 选择 ， 而 不 是 衡量 算法 性 能 用 到 的 加 法 尺度 。 
令 人 惊异 的 是 ， 这 个 技巧 虽然 简单 ， 却 能 让 这 三 位 研究 人 员 有 效 地 解决 众多 之 前 



































几 代 人 都 束手无策 的 问题 。 
积 性 权重 更 新 算法 是 如 此 优雅 ， 甚 至 令 阿 罗拉 、 哈 赞 和 卡 莱 认 为 他 们 的 算法 











是 计算 机 科学 中 最 重要 的 思想 之 一 。 因 此 ， 他 们 在 论文 的 开头 就 提议 ， 计 算 机 科 


学 的 基 三 








课程 应 该 包括 这 个 算法 ， 与 “分 治 法 ”等 更 为 人 知 的 方法 并 列 。 








积 性 权重 更 新 算法 的 有 效 性 见证 了 加 法 领域 与 乘法 领域 之 间 的 重大 差异 。 该 
算法 最 近 才 被 发 现 并 完全 理解 的 事实 表明 这 个 差异 非常 违反 直觉 。 它 佐证 了 库 效 



































C 图 灵感 兴趣 的 实际 上 只 是 概率 之 间 的 相对 度量 ， 又 叫 相 对 概率 。 图 灵 的 单位 “ 班 伯 里 ”实际 
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ae) = log P[T4D]- log, P[T,1D] hi fct ( 乘 以 一 个 乘法 常数 的 


话 ， 这 就 相当 于 香农 比特 数 之 差 ， 因 为 比特 用 的 是 以 2 为 底 的 对 数 )。 这 就 让 图 灵 能 够 绕 过 配 
分 函数 的 计算 。 
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韦 尔 的 说 法 ， 我 们 关于 指数 增长 的 直觉 实在 错 得 离谱 。 

积 性 权重 更 新 算法 最 瞩目 的 成 功 之 一 就 是 机 带 学 习 中 的 提升 算法 (boosting )。 
但 在 解释 提升 算法 与 积 性 权重 更 新 之 前 ,我 们 先 绕 个 道 ， 回 到 启蒙 运动 时 期 的 法 
国 ， 看 看 孔 多 塞 侯 项 的 一 个 绝妙 的 想法 。 

在 这 个 年 代 ， 众 多 法 国 哲 学 家 都 在 倡导 权力 分 立 ， 而 孔 多 塞 考 虑 的 则 是 司法 
判决 是 由 一 位 称职 的 法 官 进行 更 好 ， 还 是 由 多 位 没 那 么 专业 的 市 民 组 成 的 陪审 团 
进行 更 好 。 孔 多 塞 提出 了 一 个 简单 的 模型 ， 其 中 每 位 市 民 都 能 够 以 大 于 1/2 的 概率 
万 得 出 正确 结论 。 在 这 个 情况 下 ， 整 个 陪审 团 做 出 错误 判决 的 概率 会 随 着 陪审 团 人 
数 增加 而 指数 递减 “。 因 此 ， 孔 多 塞 得 出 的 结论 就 是 人 数 足 够 多 的 陪审 团 要 比 一 位 
称职 的 法 官 更 可 靠 。 

然而 孔 多 塞 提 出 的 情景 简化 过 度 ， 在 现实 中 没有 意义 ， 特 别 是 因为 其 中 最 大 
的 假设 就 是 每 位 市 民 判断 的 独立 性 。 但 是 陪审 员 必定 会 进行 互动 ， 要 预计 到 其 中 
最 健谈 的 陪审 员 会 对 其 他 人 产生 影响 一 一 而 现代 的 心理 学 实验 ， 比 如 所 罗 门 ， 阿 
施 的 实验 ,证 明了 和 群体 效应 可 以 令 个 体 在 短 时 间 内 相信 那些 明显 错误 的 陈述 。 

更 糟糕 的 是 ， 每 位 成 员 的 判断 会 以 什么 方式 相互 关联 是 很 难 预计 的 ， 而 对 障 
审 员 之 间 审 议 过 程 的 经 验 研 究 PI 得 出 了 相当 令 人 不 安 的 结论 ， 因 为 审议 过 程 似 乎 
会 将 陪审 员 推 向 比 最 极端 的 陪审 员 意 见 还 极端 的 结论 。 

如 果 有 各 种 基本 正确 但 不 太 可 靠 的 意见 ， 而 且 这 些 意见 可 能 互相 关联 的 话 ， 
有 没有 办 法 将 它们 结合 起 来 ， 得 出 特别 可 靠 的 整体 意见 ”这 就 是 计算 机 科学 家 迈 
克 尔 …， 卡 恩 斯 和 莱 斯 利 ， 瓦 利安 特 在 1988 年 提出 的 问题 。 

1997 年 ， 罗 伯 特 ' 夏 派 尔 和 约 阿 夫 ' 弗 罗 因 德 对 这 个 问题 做 出 了 肯定 的 回答 。 
他 们 的 解法 被 称 为 自 适 应 提升 算法 (adaptive boosting， 以 下 简称 Adaboost )， 这 个 
结果 让 他 们 赢得 了 2003 年 哥 德 尔 奖 这 一 殊荣 ,也 引出 了 由 维 奥 拉 和 琼斯 设计 的 首 
































































































































































































































D 令 n 为 陪审 团 的 人 数 ， 利 用 切 尔 诺 夫 不 等 式 ， 我 们 可 以 证 明 判 决 错误 的 概率 小 于 等 于 

















D 哥 德 尔 奖 是 欧洲 理论 计算 机 学 会 与 美国 计算 机 学 会 在 1993 年 共同 设立 的 奖项 ， 旨 在 奖励 理论 
计算 机 领域 中 最 杰出 的 工作 ， 是 理论 计算 机 领域 中 分 量 最 重 的 奖项 之 一 。 一 一 译 者 注 
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个 人 脸 探测 算法 。Adaboost 非 同 寻常 的 成 功 可 能 会 让 人 觉得 它 是 一 个 无 比 精巧 的 











算法 ， 但 它 其 实 只 是 利 


用 了 指数 增长 和 线性 增长 之 间 、 对 数 尺度 与 常用 尺度 之 间 





以 及 乘法 领域 与 加 法 领域 之 间 的 差异 。 


更 厉害 的 是 ， 与 积 改 





权重 更 新 这 一 推广 一 样 ，Adaboost 不 过 是 化 了 妆 的 洛 特 








卡 一 沃 尔 泰 拉 方 程 。 也 就 是 说 ， 它 不 过 是 贝 叶 斯 公式 的 近似 ! 

我 们 稍微 看 看 其 中 的 细节 。 假 设 现在 有 几 位 专家 ， 他 们 的 意见 各 不 相同 。 一 
开始 我 们 没有 数据 能 用 于 区 分 这 些 专家 的 能 力 ， 所 以 我 们 就 认为 这 些 专 家 之 间 都 
是 无 法 区 分 的 。 这 样 的 话 ， 我 们 得 出 的 结论 就 是 这 些 专家 意见 的 简单 平均 值 。 然 
而 ， 随 着 我 们 逐步 将 专家 意见 与 数据 进行 比较 ， 对 于 某 一 位 给 定 的 专家 ， 我 们 会 
将 他 的 意见 的 权重 乘 以 他 的 意见 与 实际 数据 的 吻合 程度 ， 将 得 出 的 结果 作为 新 的 
权重 。 此 后 ， 我 们 得 出 的 结论 仍然 是 不 同 专家 的 意见 的 平均 值 ， 但 这 个 平均 值 需 
要 根据 各 位 专家 的 权重 进行 加 权 。 更 准确 地 说 ， 某 位 专家 的 置信 和 度 就 是 其 意见 的 
权重 与 所 有 专家 的 意见 权重 之 和 的 比值 。 






































贝 叶 斯 主义 者 的 度假 方法 


为 了 更 好 地 理解 Adaboost， 我 们 来 看 一 个 简化 的 例子 。 假 设 你 每 年 都 会 去 一 








个 遥远 的 国家 度假 ， 为 了 选择 目的 地 ， 你 询问 了 位 朋友 ， 让 他 们 各 自给 出 建议 。 
一 开始 你 不 知道 应 该 听 哪 位 朋友 的 建议 ， 于 是 你 就 在 纸 上 列 出 所 有 建议 ， 从 中 随 
机 选择 一 个 ， 这 就 是 你 的 目的 地 。 

今年 你 抽 中 了 尼日利亚 。 现 在 就 是 将 那 位 建议 你 去 尼日利亚 的 朋友 的 预测 结 
果 与 实验 数据 对 比 的 时 候 了 。 为 此 ， 很 不 地 的 是 ， 你 必须 忍受 一 趟 到 地 球 男 一 端 
的 愉快 旅程 ! 你 的 确 度 过 了 一 段 极其 愉快 的 假期 ， 即 使 存在 感染 埃 博 拉 病 毒 的 风 











险 也 不 足 为 虑 。 











= 























即使 你 幸福 得 都 要 上 天 了 ， 还 是 不 要 忘记 更 新 你 对 朋友 的 置信 度 。 为 此 ， 你 
应 该 向 那 位 建议 你 去 尼日利亚 的 朋友 的 意见 权重 乘 以 一 个 能 代表 你 有 多 享受 这 次 














旅途 的 数 。 你 很 享受 这 次 尼日利亚 的 旅程 吗 ?” 那么 你 可 以 向 这 位 朋友 的 意见 权重 
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乘 上 一 个 稍 大 的 数 ”“。® 然 而 , 为 了 细 化 你 对 每 位 朋友 的 置信 和 度 , 你 同样 必须 想象 ， 
如 果 听 从 了 他 们 的 建议 ， 你 会 度 过 怎样 的 假期 。 在 最 理想 的 情况 下 ， 你 必须 试 一 
试 他 们 推荐 的 所 有 度假 地 点 ， 但 你 没有 那么 多 假期 。 对 你 来 说 幸运 的 是 ， 你 的 朋 
友 们 自己 就 试 过 了 这 些 推荐 的 地 点 ， 而 且 他 们 很 喜欢 讲述 自己 的 假期 。 所 以 你 很 
容易 就 知道 自己 对 他 们 的 旅程 大 概 会 有 多 满意 。 这 样 的 话 ， 你 就 要 对 每 位 朋友 的 
意见 权重 乘 以 一 个 反映 你 估计 对 他 们 各 自 的 旅程 有 多 满意 的 倍数 ”。 

又 一 个 夏天 要 到 了 ， 你 又 要 选择 下 一 个 度假 目的 地 了 。 为 此 ， 你 召集 了 朋友 
们 ， 向 他 们 征求 新 的 建议 。 你 再 一 次 在 这 些 建议 中 随机 选择 ， 但 这 次 ， 你 选择 第 i 
位 朋友 的 建议 的 概率 与 这 位 朋友 的 意见 权重 成 正比 。 也 就 是 说 ， 这 个 概率 就 是 对 
第 位 朋友 的 置信 度 。 这 样 的 话 ， 如 果 这 位 朋友 在 过 去 几 年 的 眼光 都 很 准 的 话 ， 那 
么 他 的 建议 被 抽 选 到 的 可 能 性 就 更 大 。 

这 个 朴素 的 方法 一 眼看 去 似乎 相当 复杂 ， 而 且 不 太 令 人 信服 。 然 而 ，Adaboost 
与 积 性 权重 更 新 算法 可 以 在 数学 上 保证 你 做 出 的 决定 几乎 可 以 媲美 只 听从 最 可 
笔 的 朋友 的 意见 所 做 出 的 决定 ! 这 样 做 的 话 ， 在 某 种 可 以 严格 叙述 的 意义 上 ， 
Adaboost 可 以 保证 你 相继 做 出 的 决定 几乎 是 最 优 的 “。 

需要 强调 的 重点 之 一 ， 就 是 向 不 同 的 朋友 赋予 的 初始 置信 和 度 长 远 来 说 几乎 没 
有 任何 影响 。 我 们 之 前 假设 了 每 位 朋友 的 置信 和 度 都 是 相等 的 ， 但 是 因为 这 些 置信 
度 会 以 指数 方式 演变 ， 在 算法 经 过 几 次 迭代 之 后 ， 初 始 置 信和 度 就 儿 乎 消失 了 。 
















































































D 为 了 使 计算 过 程 更 漂亮 ， 我 们 假设 向 朋友 的 意见 权重 乘 上 的 倍数 应 该 是 1+xm， 其 中 是 一 
个 比例 常数 ， 而 m e [0, 1] 则 代表 了 你 对 这 次 旅程 的 满意 程度 。 
@ 原作 者 在 此 处 叙述 有 误 ， 原文 为 “可 以 乘 以 0.9", 但 根据 原 注 ， 向 意见 权重 乘 上 的 倍数 必定 
大 于 1。 经 过 与 原作 者 讨论 ， 译 者 对 此 处 进行 了 适当 的 修饰 。 一 一 译 者 注 
图 4 wi 为 第 i 位 朋友 的 意见 权重 。 我 们 要 向 wi 乘 上 1+mm; 这 个 倍数 ， 其 中 mi 就 是 对 他 提出 的 
度假 地 点 满意 程度 的 估计 值 。 对 第 i 位 朋友 的 置信 和 度 就 由 以 下 类 似 贝 叶 斯 的 公式 给 出 : 
(12 gm, RER (i) 

































































RREO o o RERO > rom ERR) - 
I 
CD 更 准确 地 说 ， 我 们 可 以 证 明 E[ m(0)] > (nm Dm (Te 其 中 mi (D 是 你 对 第 i 








位 朋友 在 第 年 提议 的 度假 满意 度 ( 的 估计 值 )， 而 m(?) 就 是 你 对 第 1 年 的 实际 度假 地 点 的 满 
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在 更 一 般 的 情况 中 ， 贝 叶 斯 置信 和 度 的 指数 式 演变 意味 着 在 寥寥 儿 次 贝 叶 斯 推 
断 之 后 ， 先 验 置 信 度 的 作用 很 快 就 消散 了 。 正 因 如 此 ,在 面 对 足 够 多 的 数据 时 ， 
贝 叶 斯 置信 度 的 任意 性 其 实 没有 我 们 的 线性 直觉 所 暗示 的 那么 大 。 主 观 毫 不 随意 。 


















































技术 奇 点 





关于 技术 进展 ， 库 兹 韦 尔 走 得 更 远 ， 他 指责 技术 界 与 学 术 界 没有 理解 技术 的 
指数 增长 性 质 ， 比 如 摩尔 定律 就 (粗略 地 ) 断言 了 计算 机 的 计算 能 力 每 两 年 就 会 
翻 一 倍 。 同 样 ， 经 济 学 家 布 林 约 尔 松 和 麦 卡 菲 指出 ， 人 们 对 于 过 去 的 各 种 事件 赋 
予 了 过 高 的 重要 性 。 如 果 关 注 各 种 经 济 指标 ， 无 论 是 人 口 还 是 农业 产量 ,我 们 就 
能 明显 看 到 一 个 重要 的 现象 ， 它 超越 了 所 有 零星 发 生 的 事件 ， 无 论 是 古 罗 马 帝 国 
的 月 泪 、 印 刷 技 术 的 发 明 还 是 对 美洲 大 陆 的 征服 。 这 个 重要 现象 就 是 经 济 指标 势 
不 可 当 的 指数 上 升 。 

布 林 约 尔 松 、 麦 卡 菲 、 库 兹 事 尔 以 及 其 他 许多 人 认为 ， 这 种 新 技术 促成 的 指 
数 增长 说 明 未 来 会 与 过 去 大 大 不 同 。 人 工 智能 、3D 打印 、 纳 米 技术 和 遗传 学 上 的 
进步 都 昭示 着 这 样 的 未 来 ， 其 中 高 质量 消耗 品 的 大 量 生产 不 再 需要 人 类 劳动 ， 世 
界 范围 内 的 饥荒 和 疾病 都 能 得 以 根除 ， 我 们 的 生活 方式 也 会 有 翻天 覆 地 的 变化 。 

视频 主播 CGP Grey 在 一 个 题 为 《招聘 : 谢绝 人 类 》( Humans Need Not Apply ) 
的 优秀 纪录 片 中 指出 ， 即 使 在 并 不 遥远 的 未 来 ， 人 类 的 工作 甚至 会 被 嫌弃 。 对 
CGP Grey 来 说 ， 技 术 可 能 很 快 就 能 演变 到 这 样 的 地 步 ， 以 后 (几乎 ) 人 类 能 完成 
的 工作 都 可 以 由 机 器 以 更 低廉 的 价格 更 好 地 完成 口 。 布 林 约 尔 松 和 麦 卡 菲 也 有 着 
相同 的 观点 ， 他 们 预言 许多 工作 将 会 消失 。 我 自己 也 被 这 样 的 论证 说 服 了 ， 我 在 
2014 年 预测 了 2034 年 失业 率 会 超过 80% 一 一 如 果 到 了 那 时 你 发 现 我 错 了 ， 请 一 
定 要 提醒 我 这 件 事 ! 

但 麦 卡 菲 并 不 是 一 位 失败 主义 者 ,恰恰 相反 ， 他 在 一 次 TED 论坛 "3 中 谈 到 
了 “我 们 这 个 时 代 最 美妙 的 新 经 济 "。 他 还 补充 道 : "那里 没有 竞争 。” 物 质 丰 裕 是 
有 保证 的 。 我 们 可 以 重新 构思 这 个 社会 ， 其 中 人 们 不 再 需要 工作 一 一 条 件 是 机 央 
生产 的 物资 得 到 了 合适 的 分 配 。 这 种 事情 在 人 类 史上 还 从 来 没有 发 生 过 ! 
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尼克 … 博 斯 特 罗 姆 看 得 更 长 远 ， 他 认为 技术 进步 可 能 并 不 是 指数 式 的 ， 而 是 
超越 指数 式 的 。 要 理解 这 一 点 ,我们 得 回 到 指数 增长 的 特点 : 在 每 一 次 迭代 时 ， 
技术 或 它 的 某 个 量化 指标 都 会 乘 以 一 个 常数 。 然 而 对 于 博 斯 特有 罗 姆 来 说 ， 技 术 越 
进步 ， 它 继续 发 展 的 速度 就 会 更 大 。 换 句 话 说 ， 在 每 一 次 近 代 之 后 ， 技 术 会 乘 以 
一 个 每 次 迭代 都 会 增加 的 数值 。 

这 个 现象 可 以 用 微分 方程 来 建 模 。 我 在 这 一 段 要 用 一 点 数学 术语 。 如 果 你 不 
熟悉 这 些 术语 的 话 可 以 直接 跳 过 。 指 数 增长 对 应 着 微分 方程 X=x ， 而 博 斯 特 罗 姆 
眼中 的 技术 进步 则 更 贴近 X=x? 这 种 形式 。 但 这 种 方程 的 解 形 如 x(7?)=1(1- 四 也 
就 是 说 ， 这 种 增长 如 此 迅速 ， 在 有 限 的 时 间 {=1 内 ,x 就 会 达到 无 穷 大 。 

经 过 这 样 的 短暂 思考 ,我们 得 出 的 结论 就 是 技术 演变 可 能 存在 一 个 奇 点 ， 在 
那个 时 刻 ， 所 有 技术 会 突然 达到 物理 极限 。 这 个 技术 奇 点 通常 被 解释 成 超级 智 全 
(也 就 是 超越 人 类 的 人 工 智能 ) 开始 改进 自身 智能 的 时 刻 。 因 为 这 个 超级 智能 比 它 
的 设计 者 要 更 聪明 ， 所 以 它 能 够 找到 超出 我 们 能 力 的 技术 解决 方案 ， 它 的 自我 改 
进 从 而 也 会 不 受 控制 地 加 速 。 在 非常 短 的 时 间 内 ， 它 就 会 完全 改变 我 们 生活 的 世 
界 。 而 且 它 的 行为 从 根本 上 无 法 预见 ， 因 为 这 些 行动 都 来 自 一 个 远 远 超越 我 们 的 
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博 斯 特 罗 姆 并 没有 贸然 猜测 这 个 想象 中 的 奇 点 降临 的 准确 日 期 ， 但 他 并 没有 
排除 奇 点 会 在 50 年 内 出 现 的 可 能 性 。 雷 ' 库 效 韦 尔 则 更 为 大 胆 ， 他 预测 技术 奇 点 
会 在 2045 年 出 现 。 这 个 预测 让 许多 人 大 为 吃惊 。 对 于 大 部 分 人 来 说 ， 这 个 预测 其 
至 看 上 去 滑稽 到 了 令 人 脸红 的 程度 。 但 对 于 库 兹 韦 尔 来 说 ， 这 只 是 因为 大 部 分 人 
无 法 摆脱 线性 直觉 而 已 。 

我 对 这 样 的 预测 持 保 留 态度 ， 但 我 对 自己 的 保留 态度 持 更 多 的 保留 态度 ， 因 
为 我 已 经 多 次 察觉 到 自己 对 于 指数 增长 的 直觉 有 着 很 大 的 局 限 性 。 










































































如 无 必要 ， 勿 增 实体 。 


奥 卡 姆 的 威廉 (1285—1349 ) 


简洁 是 最 大 的 精巧 。% 


KPZ + ik + 芬 奇 (1452 一 1519 ) 
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第 本 之 过 
挥动 奥 卡 姆 的 剃刀 

















+ 安 斯 利 在 美国 俄 效 俄 州 被 控 谋 杀 房 东 。 安 斯 利 声称 她 





以 为 自己 活 在 《黑客 帝国 》( Matrix ) 电影 三 部 曲 的 “母体 ”之 中 ， 以 此 为 自己 辩 


中 。 人 类 在 这 个 虚拟 宇宙 


护 。 在 这 一 系列 好 莱 坞 电影 中 ,“ 母 体 ” 是 一 项 计算 机 模拟 ， 绝 大 部 分 人 类 活 在 其 








1 相互 交流 了 如 此 长 的 时 间 ， 以 至 于 (几乎 ) 没有 人 能 














够 将 模拟 与 现实 分 开 。 他 1 


门将 模拟 出 来 的 宇宙 当成 了 现实 。 























但 《黑客 帝国 》 不 过 是 电影 ， 而 相信 这 部 电影 里 的 事情 通常 被 视 为 不 理智 的 
表现 。 安 斯 利 被 认为 患 有 精神 疾病 ， 也 因此 被 判 无 罪 。 对 很 多 人 来 说 ,《 黑 客 帝 


















































国 》 只 是 虚构 作品 ， 只 有 精神 有 问题 的 人 才 会 相信 它 是 真实 的 。 


然而 ， 斯 带 芬 . 霍金 等 著名 科学 家 并 不 悦 于 认真 考虑 《黑客 帝国 》 中 的 假设 。 

















中 ”这 名 格言 虽然 被 认为 来 自 达 ' 芬 奇 ， 但 这 种 说 法 只 能 追溯 到 近代 的 文献 ， 而 且 达 ' 芬 奇 的 著 


作 中 并 没有 出 现 这 句 话 。 它 一 般 被 认为 是 后 人 的 杜撰 。 一 一 译 者 注 
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尼克 … 博 斯 特 罗 姆 其 至 提出 了 一 个 相当 有 说 服 力 的 论证 来 支持 这 个 假设 : 如 果 技 
术 人 允许 的 话 ， 或 许 人 类 比 起 现实 会 更 喜欢 在 虚拟 世界 中 滑雪 ， 在 那里 没有 严寒 ， 
雪 骨 也 不 会 对 人 身 安全 造成 威胁 。 人 们 可 能 会 逐渐 更 偏爱 虚拟 宇宙 ， 这 样 的 话 ， 
“母体 ”可 能 就 是 所 有 足够 先进 的 文明 将 迈 向 的 未 来 。 然 而 ， 发 达 的 文明 拥有 较 多 
的 人 口 。 所 以 ， 我 们 可 以 预计 宇宙 中 的 大 部 分 智慧 生命 生活 在 类 似 “ 母 体 ” 的 结 
构 中 。 但 这 样 的 话 ， 如 果 我 们 随机 选取 宇宙 中 的 一 个 智慧 生命 个 体 ， 比 如 说 我 们 
自己 ， 那 么 这 个 个 体 的 确 处 于 “母体 ”之 中 的 概率 非常 接近 1。 因 此 ， 有 关 “ 母 
体 ”的 假设 不 仅 值得 考虑 ， 甚 至 非常 可 能 是 正确 的 。 因 此 ， 向 其 赋予 一 个 难以 忽 
略 的 置信 度 也 并 非 毫 无 合理 之 处 串 ! 

我 们 甚至 可 以 走 得 更 远 ， 走 进 那些 罗 深 的 形而上学 理论 之 中 。 有 一 个 相当 极 
端的 理论 叫 作 “ 上 星期 四 主义 ”( Last-Thursdayism )。 根 据 这 个 理论 ， 整 个 宇宙 都 
是 上 星期 四 创造 出 来 的 ， 包 括 整个 地 球 、 我 们 的 所 有 文明 、 所 有 古迹 、 所 有 书籍 ， 
甚至 所 有 回忆 。 如 果 你 相信 自己 去 年 夏天 在 尼日利亚 度 过 了 一 个 假期 ， 那 只 是 因 
为 在 上 个 星期 四 一 切 被 创造 出 来 的 时 候 ， 你 的 大 脑 包含 着 在 尼日利亚 度假 的 回忆 。 
更 厉害 的 是 ， 上 星期 四 主义 是 无 法 证 伪 的 ， 而 且 完 全 合乎 物理 法 则 。 无 论 我 们 将 
来 观察 到 什么 现象 ， 都 可 以 在 上 个 星期 四 找到 它 的 原因 口 。 

但 对 于 卡尔 : 波 普尔 来 说 ， 上 星期 四 主义 与 “母体 ”假设 一 样 都 没有 任何 价 
值 ， 因 为 它们 是 无 法 证 伪 的 理论 。 这 种 回应 看 上 去 可 能 很 诱 人 ， 但 我 们 在 第 4 章 
看 到 了 ， 波 普尔 的 可 证 伪 性 既 没 有 经 验 上 的 对 应 物 ， 又 没有 理论 基础 。 我 在 这 里 
就 不 再 重复 了 。 

能 恰如其分 地 用 于 和 否定 上 星期 四 主义 和 “母体 ”假设 的 经 典 思想 并 不 是 波 普 
尔 的 哲学 ， 而 是 奥 卡 姆 剃刀 ， 这 个 名 字 来 自 哲学 家 奥 卡 姆 的 威廉 。 我 们 也 把 它 叫 
作 节 俭 原则 、 经 济 原则 或 者 简洁 原则 。 在 1319 年 ， 奥 卡 姆 这 样 写 道 :“Pluralitas 
non est ponenda sine necessitate.” 意 即 “ 如 无 必要 ， 勿 增 实体 ”。 换 句 话 说 ,简洁 的 
理论 更 可 取 。 

但 是 ， 我 们 其 实 很 难看 出 为 什么 上 星期 四 主义 在 简洁 程度 上 比 不 上 “可 观测 宇宙 
在 130 亿 年 前 突然 出 现 ， 然 后 产生 了 星系 、 人 恒星 、 行 星 、 生 物 以 及 人 类 大 脑 这 些 
复杂 事物 ”这 个 替代 理论 。 奥 卡 姆 的 简洁 原则 尽管 表面 看 似 简单 ， 但 实际 并 不 单 
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^l! 看 上 去 简单 的 东西 不 一 定 简单 ， 而 看 上 去 复杂 的 东西 也 不 一 定 复杂 ! 

事实 上 ， 要 严谨 理解 理论 简洁 性 ， 必 须 用 到 算法 复杂 度 之 类 的 有 关 复 杂 度 的 
理论 。 所以， 要 正确 描述 奥 卡 姆 剃刀 的 话 ， 所 罗 门 诺 夫 的 工作 似乎 是 无 法 避 开 的 
基石 。 


























足球 里 没有 命中 注定 


但 现在 我 们 先 着 重 阐述 奥 卡 姆 剃刀 为 何 至 关 重 要 ， 特 别 是 在 构筑 预测 性 理论 
这 方面 。 统 计 学 与 机 器 学 习 方 面 的 研究 者 需要 这 些 预 测 性 理论 ， 而 他 们 发 现 ， 如 
果 没 有 奥 卡 姆 剃刀 的 话 ， 就 会 经 常 陷 人 所谓 的 “过 度 拟 合 ”( overfitting ) 陷阱 之 中 
束手无策 ， 我 们 也 可 以 把 它 翻译 成 “过 度 诠释 "。 要 理解 过 度 拟 合 带 来 的 不 恨 后 果 
以 及 奥 卡 姆 剃刀 (有 可 能 ) 扮演 的 “救世 主 ” 角 色 ， 我 们 先 讲 一 点 闲话 ， 看 看 一 
个 处 于 过 度 拟 合 统治 之 下 的 领域 : 体育 。 

加 时 赛 已 经 开始 了 ， 吉 尼 亚 克 射 中 葡萄 牙 队 右边 门 柱 的 景象 仍然 蒙 绕 在 法 国 
球员 和 球迷 的 心头 。2016 年 欧洲 杯 法 国 对 葡萄 牙 这 场 决 赛 对 法 国 来 说 似乎 胜利 
在 望 ， 毕 竞 在 之 前 法 国 本 土 举办 的 两 次 大 型 国际 足球 赛事 中 ,法 国 队 都 启 到 了 最 
后 一 一 除了 有 一 次 在 第 二 次 世界 大 战 之 前 举办 的 赛事 中 落 败 ， 但 那 完全 是 另 一 个 
时 代 了 。 另 外 ,， 法国 在 1984 年 和 2000 年 都 赢得 过 欧洲 杯 ， 就 好 像 寓 冥 之 中 有 种 
规律 ， 会 保证 法 国 每 16 年 都 能 夺 得 欧洲 杯 。 最 后 ， 法 国 队 的 历史 证 明 ， 只 有 在 
拥有 一 位 特别 出 众 的 球员 时 ， 他 们 才能 取得 最 终 胜利 。 在 1984 EKIPE 
JE, 在 1998 年 世界 杯 与 2000 年 欧洲 杯 是 齐 达 内 ， 而 在 2016 年 欧洲 杯 大 出 风头 的 
则 是 格 列 效 曼 。 

然而 在 加 时 赛 结束 后 ， 在 这 场 决 赛 中 进 了 唯一 一 球 的 却 是 葡萄 牙 。 和 葡萄 牙 成 了 欧 
洲 杯 冠军 ， 推 翻 了 一 切 预言 以 及 一 切 看 似 已 然 确立 的 统计 规则 。 统 计 骗 了 我 们 ! 

但 统计 也 许 没 有 骗 人 。 报 纸 标题 写 着 ，2016 年 欧洲 杯 总 是 令 人 大 跌眼镜 。 在 
四 分 之 一 决赛 中 ,德国 首次 在 国际 足球 锦标 赛 中 击败 意大利 。 在 半 决 赛 中 ,法 国 
战胜 了 德国 ， 这 是 法 国 自 1958 年 世界 杯 季 军 战 以 来 对 阵 德国 的 第 一 场 胜利 。 和 葡萄 
牙 在 此 前 对 阵 法 国 的 所 有 赛事 中 惨遭 十 连 败 ， 这 次 决赛 是 他 们 首次 战胜 法 国 队 。 
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这 些 黑 马 都 获得 了 胜利 。 

格 列 兹 曼 似乎 度 过 了 完满 而 引 人 注 目的 一 年 ， 而 且 他 自身 的 表现 也 让 他 成 为 
金 球 奖 获得 者 的 大 热门 ， 这 就 像 是 足球 界 的 诺 贝尔 奖 。 然 而 在 2016 年 欧洲 杯 中 ， 
格 列 兹 曼 在 打败 曼 努 埃 尔 : 诺 伊 尔 带领 的 德国 队 之 后 ， 却 在 决赛 中 输 给 了 克 里 斯 
带 亚 诺 . 罗纳尔多 带领 的 简 萄 牙 队 。 而 几 个 月 之 前 ， 他 的 俱乐部 马德里 竞技 在 欧 
洲 冠军 联赛 中 ， 继 打败 曼 努 埃 尔 . 诺 伊 尔 所 属 的 拜仁 蔡 尼 黑 后 ， 却 在 决赛 中 输 给 
了 克里斯蒂 亚 诺 罗纳尔多 所 属 的 皇家 马德里 。 几 个 月 之 后 ， 获 得 当年 金 球 奖 的 
是 克里斯蒂 亚 诺 ， 罗纳尔多 一 一 格 列 兹 曼 只 排 第 三 名 。 

我 刚才 提 到 的 这 些 分 析 在 体育 新 闻 中 都 很 常见 ， 其 中 统计 数字 的 用 途 是 揭示 
那些 神秘 、 惊 人 甚至 令 人 不 安 的 规律 。 然 而 对 于 机 器 学 习 的 专家 来 说 ， 这 些 分 析 
可 能 没有 任何 价值 ， 因 为 它们 很 可 能 是 一 种 过 度 拟 合 。 的 确 ， 如 果 观 察 足球 历史 
并 摆弄 过 往 的 比赛 统计 数据 的 话 ， 人 们 总 是 能 找到 令 人 瞩目 的 统计 规律 。 每 一 个 
新 结果 都 会 摧毁 其 中 的 某 些 规律 ， 比 如 法 国 每 16 年 顾 得 一 次 欧洲 杯 ， 但 可 能 成 立 
的 统计 规律 足够 多 ， 不 会 出 现 所 有 规律 都 失效 的 情况 。 恰 恰 相 反 ， 数据 累积 得 越 
多 ,摆弄 数 据 获 得 虚假 统计 规律 的 方法 就 越 多 。 

这 就 是 过 度 拟 合 出 现 之 人 处。 如果 事后 解释 的 数目 比 数据 增长 得 还 快 ， 那么 无 
论 数 据 是 什么 ， 我 们 都 能 找到 办 法 解释 它们 。 体 育 评论 员 花 时 间 比 较 所 有 运动 员 
在 所 有 比赛 中 的 所 有 信息 时 通常 就 是 这 种 情况 。 这 就 是 为 什么 每 过 儿 天 我 们 就 会 
发 现 某 位 运动 员 创造 了 新 纪录 。 


























































































































过 度 诠释 的 灾难 


d) - 维 根 在 他 的 网 站 “虚假 相关 ”( Spurious Correlation ) 上 讽刺 了 这 种 过 
度 拟 合 的 现象 。 维 根 喜 欢 对 网 上 的 大 量 时 序数 据 进 行 比较 ， 系 统 地 从 中 寻找 那些 
高 度 显著 的 相关 关系 ， 然 而 这 些 相 关 关 系 在 理论 上 如 此 不 可 能 发 生 ， 实 在 无 法 让 
人 认真 对 待 。 

通过 这 种 方法 ， 我 们 可 以 发 现 尼 证 拉 斯 ' 凯 奇 出 演 电影 最 多 的 年 份 就 是 泳池 
中 溺 亡 人 数 最 多 的 年 份 ， 而 人 造 奶 油 消 费 较 高 的 年 份 往往 伴随 着 美国 缅 因 州 的 高 
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离婚 率 ; 此 外 ， 某 年 选 出 的 美国 小 姐 年 龄 越 大 ， 当 年 因 溪 伤 而 死亡 的 人 数 就 越 多 。 
幸运 的 是 ， 即 使 在 这 些 统计 结果 广为人知 之 后 ， 政 治 家 也 没有 尝试 打 断 尼 古 拉 
Hr - 凯 奇 的 电影 生涯 、 禁 止 人 造 奶 油 或 者 向 美国 小 姐 的 评委 施加 压力 …… 

泰勒 . 维 根 展示 的 这 些 事例 非常 令 人 着 迷 ， 原 因 正 是 人 们 倾向 于 和 否定 任何 因 
果 联 系 ， 即 使 这 些 联系 有 着 明确 的 相关 性 。 这 些 例子 作为 教育 素材 非常 出 色 ， 可 
以 提醒 人 们 相关 性 不 等 于 因果 ， 特 别 是 在 过 度 拟 合 的 可 能 性 很 高 的 时 候 一 一 而 我 
们 的 情况 正 是 这 样 ， 因 为 用 于 测试 相关 性 的 数据 集 个 数 远 远大 于 每 个 数据 集中 的 
数据 个 数 。 在 这 里 ， 相 关 性 就 相当 于 那些 事后 解释 ， 而 它们 的 确 远 远大 于 每 种 数 
据 的 抽样 大 小 。 

然而 ， 面 对 任何 显著 相关 性 都 否定 因果 关系 的 存在 不 是 我 们 大 部 分 人 会 做 出 
的 反应 ， 而 过 度 拟 合 的 陷阱 也 并 不 仅 限于 体育 领域 。 我 们 在 新 闻 中 也 能 经 常 看 到 
大 量 的 过 度 诠释 ， 人 们 对 其 非常 认真 ， 而 它们 导致 的 后 果 可 能 相当 严重 。 

为 了 教育 大 众 ，FiveThirtyEight 网 站 提供 了 一 个 界面 四， 你 可 以 在 其 中 轻松 摆 
弄 与 美国 政治 相关 的 数据 。 在 捣 鼓 几 下 之 后 ， 你 可 以 找到 一 组 数据 证 明 你 支持 的 
党 派对 于 美国 经 济 有 着 正面 影响 ， 而 更 厉害 的 是 ， 只 需要 花 几 秒 ， 你 就 能 找到 一 
项 忆 值 超过 了 “科学 方法 ”所 需 阔 值 的 数据 ! 也 就 是 说 ， 这 项 数据 足够 显著 ， 可 
以 发 表 在 科学 期 刊 上 一 一 那么 显然 也 够 格 发 表 在 《纽约 时 报 》 上 ! 

FiveThirtyEight 的 方法 能 够 得 出 任何 预先 给 定 的 结论 ， 因 为 这 个 网 站 提供 了 大 
量 方法 来 衡量 某 个 政治 党 派对 经 济 的 影响 。 那 里 有 不 同 的 经 济 指标 ( 失业 率 、 通 
货 膨胀 、 国 内 生产 总 值 、 金 融 市 场 )、 权 力 机 关中 各 党 派 在 不 同位 置 的 代表 (总 
统 、 州 长 、 参 议员 、 众 议员 )， 还 有 各 种 对 这 些 领 导 者 的 相对 重要 性 的 比较 方法 ， 
人 们 甚至 还 可 以 选择 是 否 将 经 济 衰退 纳入 考虑 。 最 重要 的 是 ， 人 们 可 以 选择 各 种 
参数 的 组 合 ， 比 如 说 同时 考虑 失业 率 和 国内 生产 总 值 ， 因 此 这 个 网 站 可 以 提供 高 
ik 2048 个 关于 某 个 政治 阵营 如 何 影 响 经 济 的 可 能 解释 。 

然而 你 要 记得 ， 即 使 真正 显著 的 效应 并 不 存在 , p 值 方法 每 20 次 就 会 有 一 次 
得 出 显著 的 结果 ! 因此 ， 在 这 个 情况 下 ， 我 们 预计 会 有 一 百 多 项 统计 满足 可 以 发 
表 的 科研 标准 ! 更 奇怪 的 是 ， 如 果 再 摆弄 一 下 网 站 上 的 数据 ， 我 们 就 会 察觉 到 ， 
要 得 到 无 论 是 对 民主 党 有 利 还 是 对 共和 党 有 利 的 显著 统计 结果 都 很 容易 。 也 就 是 
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说 ， 只 要 对 FiveThirtyEight 上 的 数据 捣 鼓 足够 长 的 时 间 ， 你 就 可 以 轻松 发 表 一 篇 
题 为 《证 明 x 会 损害 经 济 的 50 个 统计 数据 》 的 “标题 党 ""” 文章 ,无 论 * 是 民主 党 
还 是 共和 和 党 ! 

fH FiveThirtyEight 的 网 页 界面 实际 上 能 做 的 非常 有 限 。 如 果 一 位 记者 受到 编 
辑 部 的 压力 ， 而 自己 又 对 计算 机 足够 熟悉 ， 或 者 认识 一 位 足够 熟悉 计算 机 的 朋友 , 
那么 他 很 容易 就 能 生成 上 万 甚至 上 亿 种 某 个 政治 阵营 对 经 济 的 影响 的 可 能 解释 ， 
足够 在 接 下 来 的 一 百年 里 每 天 都 发 表 上 万 条 统计 学 上 的 显著 结论 。 这 就 是 过 度 拟 
合 贻 害 深远 之 处 。 在 探索 言 之 有 理 的 解释 时 ， 无 论 为 什么 立场 辩护 ， 人 们 都 必然 
能 找到 有 显著 性 的 统计 数据 作为 佐证 一 一 人 们 甚至 通常 不 会 意识 到 这 些 统计 数据 
的 发 现 并 没有 什么 神奇 之 处 。 即 使 每 个 统计 数据 都 不 太 可 能 具有 显著 性 ， 但 所 有 
统计 数据 都 没有 显著 性 更 不 可 能 。 

这 个 简化 后 的 结论 解释 了 为 什么 在 社会 话题 、 种 族 主义 相关 政策 、 怒 饰 主义 、 
粮食 与 宗教 等 话题 中 会 出 现 众多 互相 冲突 的 文章 。 毕 竞 某 个 主题 在 人 群 中 引发 的 
好 奇 心 越 大 ， 就 会 有 越 多 的 记者 花 时 间 人 研究 这 个 主题 。 这 是 一 个 恶性 循环 ， 恶 果 
就 是 会 产生 互 不 相 容 的 信念 。 这 些 信 念 的 基础 几乎 完全 来 自 过 度 拟 合 ， 但 我 们 中 
的 大 部 分 人 看 不 见 这 种 过 度 拟 合 ， 因 为 我 们 读 到 的 只 是 记者 熟练 地 采集 并 选择 出 
来 的 具有 显著 性 的 统计 数据 ， 而 这 些 记者 又 被 老板 副 着 要 引起 艇 动 。 而 如 果 我 们 
将 这 些 东 西 与 第 11 章 谈 到 的 “标题 党 ”结合 起 来 的 话 ， 那 么 似乎 不 可 避免 会 直接 
导致 失控 的 虚假 信息 的 泛滥 。 

目前 ， 绝 大 部 分 对 自己 深信 不 疑 的 活动 分 子 一 直 被 困 于 过 分 拟 合 这 个 陷阱 中 ， 
无 法 脱身 。 当 人 们 要 为 自己 的 立场 辩护 时 ， 只 需 探索 足够 多 的 可 能 解释 ， 就 能 从 
中 找到 似乎 能 论证 这 个 立场 的 解释 。 只 要 人 们 花 足 够 长 的 时 间 搜 索 ， 总 会 找到 一 
个 事后 编造 的 解释 外 。 

不 季 的 是 ， 据 心理 学 家 乔纳森 ' 海 特 所 说 ， 社 会 科学 中 的 实验 一 次 又 一 次 表 
明 ， 人 类 总 是 先 选 好 立场 ， 然 后 再 用 ( 自己 相信 和 是 ) 理性 的 论据 来 为 自己 的 立场 
辩护 。 理 性 对 我 们 来 说 只 是 一 种 工具 ， 用 于 为 我 们 预先 建立 好 的 信念 寻找 或 者 
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D ”这些 计算 非常 粗略 ， 并 非 真 正 正确 ， 但 也 大 概 说 明了 我 们 能 从 FiveThirtyEight 提供 的 分 析 工 
中 得 到 些 什 么 。 
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“ 喷 出 ”解释 。 然 而 ， 这 些 事后 的 解释 无 处 不 在 ， 只 需要 一 个 足够 好 的 理由 ， 我 们 
就 会 对 自己 想 要 相信 的 东西 深信 不 疑 加 。 

这 就 是 我 们 不 断 在 犯 的 错误 ， 这 就 是 迷信 与 超自然 信仰 出 错 的 地 方 ， 这 也 是 
上 星期 四 主义 有 问题 的 地 方 。 

对 于 所 有 新 观察 结果 来 说 ， 都 存在 一 个 新 的 解释 ， 可 以 将 这 个 观察 结果 变 得 
与 上 星期 四 主义 相 容 。 实 际 上 ， 上 星期 四 主义 的 信奉 者 在 解释 这 个 围绕 着 我 们 的 
世界 时 ， 最 终 发 展 出 的 宇宙 模型 都 会 与 科学 家 们 构筑 的 宇宙 模型 一 样 。 但 这 样 的 
话 ， 上 星期 四 主义 这 个 假设 就 会 变 得 多 余 ， 它 无 法 让 人 们 解释 该 理论 其 他 部 分 无 
法 解释 的 东西 。 正 因为 这 个 假设 是 多 余 的 ， 所 以 奥 卡 姆 剃刀 会 把 它 剃 掉 。 
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追寻 简单 性 的 复杂 旅程 


你 现在 也 明白 了 ， 奥 卡 姆 剃刀 是 对 抗 过 度 拟 合 倾向 的 工具 。 奥 卡 姆 剃刀 提示 
我 们 ， 当 每 次 发 现 新 数据 时 ， 与 其 在 相互 竞争 的 各 种 理论 之 间 来 回 切换 ， 不 如 忽 
略 那些 过 于 复杂 的 理论 ， 哪 伯 这 会 导致 所 有 数据 不 能 得 到 完美 解释 。 毕 竟 ， 一 般 
来 说 数据 的 成 因 众 多 ， 要 进行 完美 的 解释 简直 是 天 方 夜 谭 。 

蜗 子 掷 出 6， 空气 中 每 个 分 子 的 位 置 都 有 可 能 对 这 个 结果 产生 影响 。 然 而 跟踪 
空气 中 的 每 个 分 子 并 不 现实 ， 特 别 是 因为 这 些 分 子 的 个 数 远 远 超出 了 时 至 今日 制 
造 的 所 有 计算 机 的 储存 空间 总 和 。 但 撕 艇 子 比 我 们 更 感 兴趣 的 各 种 社会 问题 远 远 
简单 得 多 。 如 果 我 们 无 法 完全 解释 山 子 如 何 掉 到 桌子 上 ， 那 么 要 对 政治 、 疏 怖 3 
义 和 营 养 学 方面 的 问题 得 出 最 终结 论 的 期 望 就 完全 是 呢 语 了 。 我 们 必须 接受 并 拥 
抱 模 型 的 不 确定 性 。“ 所 有 模型 都 是 错 的 "， 这 是 件 好 事 ! 
第 一 个 理解 不 进行 完美 解释 的 重要 性 的 人 大 概 就 是 被 称 为 “现代 科学 之 父 ” 
的 伽利略 。 他 最 伟大 的 天 才 之 举 就 是 挑战 亚 里 士 多 德 的 物理 学 ， 断 言 并 不 是 越 重 
的 物体 就 天 然 地 下 落得 越 快 。 伽 利 略 的 这 一 思想 又 被 称 为 自由 落体 定律 ， 但 它 对 
于 实验 来 说 却 是 荒 雇 的 。 捡 起 一 根 羽 毛 和 一 块 石头 ， 然 后 让 它们 自由 下 落 ， 你 就 
会 看 到 伽利略 错 了 。 

但 伽利略 的 天 才 之 处 就 在 于 ， 他 理解 到 物体 下 落 的 内 在 性 质 只 是 它 运 动 的 一 
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部 分 原因 。 各 种 物体 都 受到 空气 的 作用 力 ， 而 羽毛 更 其 。 空 气 对 较 轻 的 物体 的 阻 
得 大 于 对 较 重 的 物体 的 阻碍 ， 这 种 阻碍 甚至 可 以 让 乌 类 飞 起 来 。 伽 利 略 因此 提出 ， 
如 果 没 有 空气 ， 那 么 空气 的 效应 也 会 消失 ， 而 我 们 就 会 观察 到 物体 本 质 的 下 落 过 程 ， 它 
应 该 与 物体 的 质量 无 关 。 伽 利 略 指出 ， 在 真空 中 所 有 物体 都 会 以 相同 的 速度 下 落 。 

人 们 经 常 说 伽利略 登 上 了 比萨 斜 塔 的 塔 项 来 测试 他 的 自由 落体 定律 ， 但 这 个 
故事 很 有 可 能 完全 是 由 伽利略 的 学 生 捏 造 出 来 的 。 毕 竟 如 果 伽 利 略 实际 做 过 实验 
的 话 ， 他 就 会 观察 到 更 重 的 物体 因为 受 空气 阻力 影响 较 小 而 下 落得 更 快 。 可 以 肯 
定 的 是 ， 伽 利 略 的 实验 并 不 是 实际 的 实验 ， 而 是 思想 实验 ,我 在 这 里 就 不 细 说 了 四， 
它 证 明了 “物体 质量 是 影响 物体 下 落 的 唯一 因素 ”这 个 假设 是 自 相 矛盾 的 一 一 除 
非 假 设 物体 的 质量 对 于 下 落 没有 本 质 上 的 影响 。 

出 于 同一 种 思考 方式 ， 伽 利 略 还 有 另 一 个 天 才 想 法 ， 那 就 是 相对 性 原理 。 这 
一 原理 断言 ， 一 个 坐 在 船上 没有 窗户 的 密闭 货舱 中 的 人 不 可 能 知道 这 艘 船 是 不 是 
在 运动 。 他 曾 这 样 说 过 :“ 运 动 如 同 无 有 。” 在 这 个 问题 上 ,实验 同样 不 一 定 会 确证 
伽利略 的 说 法 一 一 我 们 可 以 想象 这 笨 船 在 运动 时 会 比 停泊 在 港口 时 晃动 得 更 厉害 。 
然而 理论 与 实践 之 间 的 差异 足够 微弱 且 任 意 ， 使 得 伽利略 对 于 自己 提出 的 运动 相 
对 性 有 着 充足 的 信心 。 不 久之 后 ， 他 对 相对 性 原理 的 这 种 置信 和 度 让 他 将 太阳 放置 
在 了 宇宙 的 中 心口。 

在 这 两 个 例子 中 ， 伽 利 略 的 天 才 之 处 体现 在 他 偏好 原理 的 简洁 与 优雅 ， 而 非 
它们 与 实际 的 符合 程度 。 这 就 是 为 了 避免 其 他 人 陷 进 过 度 拟 合 的 陷阱 而 应 用 奥 卡 
姆 剃刀 的 杰出 例子 。 半 个 世纪 以 后 ， 轮 到 艾 萨 克 ' 牛顿 提出 动力 学 基本 原理 ， 这 
一 原理 可 以 用 4 个 符号 来 概括 : F=ma。 两 个 世纪 后 ， 詹姆斯. 克拉 克 … 麦克 斯 
囊 在 说 明 他 写 出 的 方程 可 以 同时 解释 电 、 磁 和 光 的 时 候 ， 强 调 的 也 是 这 些 方程 的 简 
洁 与 优雅 。 所 有 这 些 绝妙 的 理论 都 基于 同一 个 原则 : 去 掉 互 不 相 容 的 多 个 特 设 解释 ， 
用 简单 而 普 适 的 原理 来 代替 它们 ， 哪 怕 要 付出 理论 不 能 完美 解释 所 有 现象 的 代价 。 



















































































































































































世事 并 非 一 贯 简单 


然而 ， 如 果 你 相信 最 优秀 的 理论 必定 简单 ， 那 可 就 错 了 。 气 象 模型 的 极端 复 
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已 经 众所周知 ， 而 


杂 
杂 得 可 怕 的 模型 














同样 ，2016 年 在 证 
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现代 神经 科学 强烈 暗示 ， 对 人 类 大 脑 的 理解 不 可 避免 需要 复 
可 能 必须 跟 大 脑 本 身 一 样 复杂 ! 


棋 上 打败 李 世 石 的 人 工 智能 AlphaGo 也 是 如 此 复杂 ， 必 须 








用 计算 机 才能 将 其 表示 出 来 。Cepheus 和 Libratus 这 两 个 在 扑克 上 打败 人 类 选手 的 


人 工 智能 也 是 如 此 (9; 





实际 上 我 们 在 讨论 所 罗 门 诺 夫 妖 时 ， 已 经 看 到 了 研究 某 个 现象 所 必需 的 复杂 








度 是 什么 : 数据 ( 遵循 的 概率 分 布 ) 的 所 罗 门 诺 夫 复杂 度 。 即 使 艾 伦 ' 图 灵 当 时 
没有 认识 到 这 个 概念 的 形式 定义 ， 他 对 这 个 概念 的 理解 却 已 经 比 任何 人 更 深远 。 
图 录 于 1950 年 发 表 的 那 篇 具有 历史 意义 的 论文 束 已 经 提出 了 “能 够 跟 人 类 一 样 说 








话 的 计算 机 最 少 需要 多 少 复杂 度 ” 这 个 问题 。 依 笔 当 时 神经 科学 的 初步 进展 ， 图 


灵 估计 ， 要 建立 
也 就 是 说 ， 对 于 








图 灵 来 说 ， 








能 与 人 类 一 样 进行 交流 的 模型 ， 
口头 语 中 的 所 罗 门 诺 夫 复杂 度 大 概 就 在 十 亿 字 节 这 个 








最 简单 的 算法 也 需要 数 十 亿 字 节 。 


数量 级 上 。 我 们 会 在 第 14 章 更 详细 地 探讨 这 个 话题 。 
同样 ， 生 物 学 、 社 会 学 与 经 济 学 中 众多 现象 的 所 罗 门 诺 夫 复杂 度 可 能 远 远 超 出 这 
个 数量 ， 因 此 我 们 的 大 脑 也 就 不 可 能 理解 这 些 现 象 ， 因 为 大 脑 储 存 空间 的 上 限 似乎 只 
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ji 对 生物 学 、 社 会 学 和 经 济 学 时 ， 


切 简 单 模型 都 必定 失败 。 


然而 庞大 的 模型 会 将 我 们 暴露 在 过 度 拟 合 的 风险 中 。 人 允许 我 们 在 不 出 现 过 度 
拟 合 的 情况 下 提升 复杂 度 的 方法 已 经 成 为 数据 科学 中 的 流行 用 语 ， 那 就 是 大 数据 。 
我 们 手头 上 的 数据 越 多 ， 我 们 就 越 能 提升 模型 的 复杂 度 。 这 个 原则 甚至 还 有 一 种 





严谨 的 阐述 方式 ， 那 就 是 统计 学 习 基 本 定理 














3], 








粗略 来 说 ， 这 个 定理 确定 了 调整 


某 个 模型 中 的 参数 时 必需 的 抽样 数目 ， 或 者 反 过 来 说 ， 给 定 抽样 的 数目 ， 这 个 定 





理 就 会 告诉 我 们 需要 考虑 的 模型 要 多 复杂 
统计 学 习 基 本 定理 中 用 于 量化 复杂 度 的 指标 是 VC 维 


合适 








o 








度 ， 这 个 名 字 来 自 两 位 


























计算 机 科学 家 弗 拉 基 米 尔 . 瓦 普 尼克 和 阿 列 克 谢 * 契 尔 沃 年 奇 斯 。 这 一 概念 的 严 
格 定义 对 我 们 来 说 有 点 太 复杂 VO 粗略 地 说 ，VC 维度 计量 的 是 我 们 能 够 对 给 定 

















(D 在 这 里 ， 





个 假设 就 是 


足以 下 条 件 的 了 的 最 大 子 集 Xma 的 大 小 Xna: 所 有 





个 函数 了 一 了 。 由 假设 构成 


的 某 个 集合 XC y* 的 VC 维度 ， 就 是 满 














的 某 些 假设 限制 到 Xs 上 得 到 。 





如 Xmas 一 了 的 函数 都 可 以 通过 将 中 
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数据 做 出 的 特定 解释 的 数目 。 我 们 可 以 从 统计 学 习 基 本 定理 得 出 的 规则 大 概 是 ， 
抽样 数目 应 该 是 我 们 考虑 的 所 有 解释 组 成 的 集合 的 VC 维度 的 大 约 100 ff 








交叉 验证 





目前 为 止 , 我 重点 强调 的 是 过 度 拟 合 的 问题 ， 因 为 这 大 概 是 我 们 最 经 常 犯 的 
错误 。 然 而 ， 反 过 来 也 存在 所 谓 的 “ 拟 合 不 足 ”， 或 者 说 “诠释 欠缺 ”的 问题 。 拟 
合 不 足 就 是 没有 足够 重视 理论 与 实际 之 间 的 差异 。 通 常 ， 在 偷懒 忽略 不 利于 自身 
信念 的 数据 时 ， 人 们 就 算 犯 了 拟 合 不 足 这 个 错误 一 一 即使 对 于 人 类 的 情况 来 说 也 
是 如 此 ， 与 机 器 学 习 算法 不 一 样 ， 这 个 问题 通常 要 归结 于 认 知 偏差 。 

在 过 度 拟 合 与 拟 合 不 足 之 间 找 到 平衡 点 是 数据 科学 中 的 经 典 问题 ， 通 常 被 认 
为 悬而未决 。 有 时 候 人 们 会 用 偶 差 -方差 困境 (bias-variance dilemma ) 5 来 说 明 
这 个 问题 。 想 象 一 下 ， 现 在 我 们 希望 预测 某 些 数据 x 的 性 质 y。 为 此 ， 我 们 可 以 收 
AE Kit Qc, y) 的 配对 例子 。 令 5 为 这 些 配 对 例子 的 集合 ,f(x, S) 为 我 们 的 预测 。 
钢 在 假设 S 是 一 个 随机 的 训练 集 。 我 们 会 得 到 的 均 方 误差 是 



























































ua 


EL 6o S) -Y] SELS Œ, S) -yY + Var; (f (x, 5) 

这 个 公式 可 以 写成 “误差 平方 等 于 偶 差 平方 加 上 方差 "。 也 就 是 说 ， 误 差 可 以 
分 解 为 两 部 分 。 首 先 ， 第 一 部 分 误差 来 自 算法 平均 而 言 在 预测 上 的 不 准确 度 ， 这 
就 是 偏差 ;然后 ， 另 一 部 分 误差 来 自 不 同 训练 集 之 间 差 异 导致 的 预测 浮动 ， 这 就 
是 方差 。 

于 是 ， 拟 合 不 足 对 应 的 情况 是 使 用 的 学 习 算 法 过 于 刻板 ， 无 法 很 好 地 适应 数 
据 ， 因 此 导致 预测 中 的 偏差 。 要 解决 拟 合 不 足 的 问题 ， 最 简单 的 办 法 通常 就 是 增 
加 学 习 算 法 的 复杂 度 。 一 般 来 说 我 们 可 以 增加 参数 的 数目 ， 然 而 ， 这 样 就 会 有 过 
度 拟 合 的 风险 。 过 度 拟 合 就 是 过 分 贴近 数据 ， 因 此 训练 集 抽样 中 的 随机 因素 对 其 







































































D 这 一 结论 的 形式 化 描述 需要 用 到 概率 近似 正确 学 习 (probably approximately correct learning， 简 称 
PAC-learning ) 的 概念 。 粗 略 地 说 ， 统 计 学 习 基 本 定理 断言 ， 要 以 某 个 大 概率 1—0 确定 某 个 解释 


i log(1/ó 
对 于 假设 集合 允 来 说 是 “c_ dip" 的话， 至 少 需 要 的 抽样 数 日 是 9 [ee Foata) l 
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影响 过 大 。 要 避免 这 样 的 浮动 ,适当 的 做 法 是 减少 参数 的 数目 。 问 题 在 于 ， 要 先 
验 地 得 出 合适 的 拟 合 程度 是 个 棘手 的 问题 ， 因 为 这 似乎 属于 数据 本 身 的 内 在 性 质 。 

在 实践 中 ， 数 据 科学 家 会 使 用 交叉 验证 的 方法 。 对 最 优秀 模型 的 搜索 被 分 成 
两 个 阶段 。 首 先 ， 我 们 考虑 那些 复杂 度 不 超过 某 个 水 平 K 的 模型 ， 一 般 来 说 就 是 
那些 拥有 人 至 多 KK 个 参数 的 模型 ,然后 我 们 在 其 中 选择 能 最 好 地 解释 训练 集 的 模型 。 
接 下 来 我 们 会 计算 选 出 的 模型 在 男 一 组 被 称 为 “测试 集 ” 的 数据 上 表现 如 何 。 

所 谓 的 交叉 验证 ， 就 是 优化 这 个 复杂 程度 天 。 首 先 从 非常 小 的 入 值 开 始 ， 这 
时 我 们 暂时 处 于 拟 合 不 足 的 区 域 中 ， 考 虑 的 那些 模型 过 于 死板 ， 无 法 对 数据 进行 
解释 。 当 天 增加 时 ， 算 法 在 测试 集 上 的 表现 会 越 来 越 好 。 这 并 不 令 人 意外 ， 因 为 
我 们 允许 模型 拥有 更 大 的 灵活 性 。 然 而 这 种 表现 的 上 升 在 某 一 点 处 会 停止 ， 我 们 
在 这 里 就 进入 了 过 度 拟 合 的 区 域 。 尽 管 最 优秀 的 模型 在 训练 集 上 的 表现 越 来 越 好 ， 
但 它 在 测试 集 上 的 表现 自 此 之 后 却 会 降低 。 找 到 使 这 种 转变 发 生 的 天 值 正 是 对 抗 
过 度 拟 合 这 一 危险 的 最 好 的 方法 之 一 (图 12.1 )。 































































































错误 率 
À 











最 优 复 杂 度 复杂 度 K 


图 12.1 实 线 表示 训练 集 的 错误 率 ， 模 型 的 复杂 度 越 大 ， 这 一 错误 率 也 越 低 。 虚 线 表示 测 
ea sai 它 代 表 通 过 训练 集 计 算 而 来 的 参数 的 泛 化 能 力 。 我 们 看 到 在 这 里 
要 做 出 权衡 。 复 杂 度 过 高 会 损害 泛 化 能 力 





交叉 验证 中 的 天 值 就 是 数据 科学 家 所 说 的 “ 超 参 数 ”( hyperparameter )， 与 之 
相对 的 是 模型 在 交叉 验证 第 一 步 中 被 优化 的 那些 参数 Um. 

但 是 交叉 验证 也 有 局 限 性 。 比 如 说 ， 它 假设 测试 集 只 会 被 用 于 测试 模型 
的 超 参数 。 但 通常 发 生 的 情况 是 某 个 测试 集 被 用 来 测试 大 量 不 同 的 学 习 模 型 ， 
ImageNet、CIFAR、MNIST 等 机 器 学 习 比 赛 就 是 这 样 的 情况 。 这 样 的 话 ， 测 试 集 
就 变 成 了 某 种 意义 上 的 训练 集 。 于 是 人 们 有 可 能 会 过 度 拟 合 测试 集 。 
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幕布 斯 兰 尼 正 则 化 














1996 年 ， 统 计 学 家 罗伯特 蒂 布 斯 兰 尼 有 了 一 个 新 想法 ， 他 引入 了 男 一 个 超 
参数 来 调整 线性 回归 。 线 性 回归 可 能 是 科学 中 最 常用 的 技巧 。 早 在 18 世纪 末 ， 博 
新 科 维 克 、 拉 普 拉 斯 、 勒 让 德 和 高 斯 就 已 经 定义 了 这 种 拟 合 法 ， 并 将 其 用 于 消除 
天 体 测量 误差 以 及 在 这 种 误差 存在 的 情况 下 进行 预测 9。 

线性 回归 的 作用 之 一 ， 就 是 让 我 们 能 够 通过 p 个 潜在 的 原因 来 解释 某 个 感 兴 
趣 的 变量 。 假 设 有 nn 组 抽样 数据 ， 当 n Hp 大 得 多 时 ,我 们 可 以 毫 无 问题 地 应 用 
线性 回归 。 然 而 在 遗传 学 等 诸多 问题 之 中 情况 就 反 过 来 了 ， 潜 在 原因 的 数目 bp À 
于 抽样 大 小 n。 这 时 ， 高 维 线性 回归 就 是 个 非常 糟糕 的 主意 了 ， 因 为 它 必然 会 导致 
严重 的 过 度 拟 合 。 

带 布 斯 兰 尼 提 出 ， 可 以 测量 线性 回归 的 复杂 度 并 惩罚 过 高 的 复杂 度 。 比 如 说 ， 
如 果 某 个 牵涉 大 量 潜在 原因 的 线性 回归 结果 要 被 保留 下 来 ， 那么 它 对 数据 的 解释 
就 必须 远 远 优 于 那些 牵涉 潜在 原因 数量 更 少 的 线性 回归 结果 。 这 一 原则 的 提出 催 
生 了 所 谓 的 LASSO 回归 “。LASSO 回归 用 到 的 技巧 之 后 被 推广 并 应 用 到 机 器 学 习 
的 众多 问题 之 中 ， 我 们 将 这 些 应 用 统称 为 正则 化 (regularisation )。 

让 我 们 的 大 脑 皮 层 以 及 其 中 大 量 神经 元 部 分 避免 过 度 拟 合 的 也 许 就 是 某 种 形式 
的 正则 化 。 毕 竟 ， 我 们 会 活 大 约 3x10? 秒 ， 但 我 们 的 大 脑 包含 大 约 10 个 神经 连 
接 ， 过 度 拟 合 的 风险 非常 大 。 然 而 ， 正 则 化 可 以 让 我 们 根据 抽样 来 调整 模型 的 拟 合 
程度 。 正 则 化 技巧 已 经 在 实践 中 无 数 次 证 明了 它们 大 有 用 处 ， 这 些 技巧 已 经 成 为 数 
据 分 析 中 不 可 或 缺 的 工具 ， 无 论 分 析 手 段 是 线性 回归 、 线 性 分 类 还 是 神经 网 络 。 

然而 正则 化 也 有 其 神秘 之 处 。 为 什么 它 可 以 作为 迈 向 最 优 解释 的 重要 向 导 ? 
统计 学 习 基 本 定理 对 这 个 问题 给 出 的 回答 还 很 不 完全 。 更 好 的 解答 提示 来 自 稳健 


优化 〈robust optimization )。 




























































































































































































中 线性 回归 相当 于 将 某 个 变量 y 的 解释 分 解 为 不 同 原因 x,, …, x, 的 线性 组 合 再 加 上 误差 e。 
这 样 的 话 ， 我 们 有 y=pBixi+…+foxpt+e。 经 典 的 做 法 就 是 确定 参数 pl, …, 6,， 使 得 抽样 数据 
中 预测 误差 平方 e 的 和 达到 最 小 值 。 蒂 布 斯 兰 尼 的 绝妙 想法 在 于 最 小 化 这 个 平方 和 与 向 量 
Gf, Br) 范 数 的 某 个 组 合 ， 通 常会 采用 1- 范 数 ， 也 就 是 所 有 pb 的 绝对 值 之 和 。 
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稳健 优化 




















稳健 优化 的 动机 来 自 下 面 的 观察 : 所 有 数据 中 都 埋藏 着 不 准确 性 甚至 错误 。 
在 机 器 学 习 中 ， 我 们 会 说 数据 中 有 噪声 。 因 此， 所 有 通过 优化 得 到 的 解答 都 必定 
只 有 在 面 对 带 有 错误 的 数据 时 才 是 最 优 的 。 在 面 对 正 确 的 数据 时 ， 这 些 解 答 其 至 
可 能 完全 不 合适 。 

为 了 在 数据 存在 噪声 时 仍然 得 到 足够 高 效 的 解答 ， 稳 健 优化 首先 会 识别 出 一 
个 不 确定 性 集合 "， 其 构造 方式 能 使 实际 数据 以 非常 高 的 概率 处 于 这 个 不 确定 性 集 
合 之 中 。 然 后 稳健 优化 会 选择 一 个 对 于 不 确定 性 集合 中 的 所 有 可 能 数据 都 有 效 的 
解答 。 更 厉害 的 是 ， 即 使 面 对 不 确定 性 集合 中 最 糟糕 的 数据 ， 稳 健 优化 也 可 以 选 
择 最 合适 的 解答 。 它 优化 的 是 最 坏 的 情况 。 

令 人 惊讶 的 是 ， 强 调 测量 数据 的 不 准确 性 可 以 让 我 们 解释 神经 元 经 常 不 正常 
工作 的 有 用 之 处 。 神 经 元 欠缺 稳定 性 实际 上 可 能 是 一 张 王牌 ， 而 不 是 天 生 的 缺陷 。 
当 某 个 神经 元 运行 出 错时 ， 它 会 扰乱 信号 ， 就 好 像 是 有 人 为 了 在 原始 数据 中 加 入 
不 确定 性 而 稍微 改变 了 数据 集 那样 。 在 一 次 又 一 次 细 化 自身 对 于 这 个 世界 的 模型 
后 ,我 们 的 大 脑 会 因此 探索 到 各 种 不 同 的 不 确定 性 并 为 其 做 出 调整 ， 而 不 是 配合 
只 包含 一 开始 那 种 噪声 的 数据 。 

此 外 ， 目 前 许多 深度 学 习 的 使 用 者 也 用 到 了 这 个 技巧 。 他 们 利用 人 工 神经 元 网 
络 来 发 现 不 同 的 模型 ， 用 于 解释 一 些 庞大 的 数据 库 。 这 些 使 用 者 会 在 不 同 的 时 刻 
随机 关闭 一 小 部 分 神经 元 ， 然 后 在 这 种 情况 下 测试 神经 网 络 的 功能 。 这 种 技巧 又 
被 称 为 随机 失 活 〈 dropout )。 人 们 发 现 它 是 对 抗 过 度 拟 合 的 一 种 无 比 强大 的 手段 。 

正则 化 与 稳健 优化 都 可 以 用 于 对 抗 过 度 拟 合 ， 但 这 两 种 技巧 之 间 有 什么 联系 
呢 ? 实际 上 它们 是 等 价 的 。 在 众多 问题 中 ,我们 可 以 证 明 ， 所 有 通过 正则 化 得 到 
的 解答 都 可 以 通过 先 选 择 某 个 不 确定 性 集合 然后 再 对 其 应 用 稳健 优化 得 到 。 反 过 
来 说 ， 给 定 某 个 不 确定 性 集合 ， 我 们 通常 可 以 确定 与 其 等 价 的 正则 化 。 也 就 是 说 ， 
我 们 可 以 将 正则 化 看 成 某 种 处 理 数据 噪声 的 方法 ， 以 此 解释 它 的 有 效 性 ”。 史 9 


























































































































































































































中 ”在 一 维 的 情况 下 ， 不 确定 性 集合 对 应 的 是 置信 区 间 。 
D 这 一 点 的 证 明 通 常 需要 用 到 优化 理论 中 的 对 偶 理论 。 
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但 还 有 更 厉害 的 方法 ， 比 这 厉害 得 多 。 


用 贝 叶 斯 方法 解决 过 度 拟 合 * 





我 们 可 以 用 贝 叶 斯 主义 的 术语 来 自然 地 解释 正则 化 。 回 想 一 下 通过 对 数 翻译 
到 加 法 领域 中 的 贝 叶 斯 公式 ， 它 可 以 写成 : 

















log P[T|D]=log P[DIT]+log P[T]-log PID] 


机 器 学 习 与 稳健 优化 中 的 方法 一 般 就 是 在 给 定数 据 的 前 提 下 选择 最 可 信 的 理 


N 


论 7。 这 一 理论 又 被 称 为 最 大 后 验 (maximum a proteriori， 以 下 简称 MAP) 模型 ， 
2 








它 能 使 P[7ID] 最 大 化 ， 也 就 等 价 于 使 log P[7ID] 最 大 化 。 


这 时 ， 


-logP[D] 这 个 量 并 不 重要 ， 因 为 它 与 7 无 关 。 因 此 ,计算 MAP 模型 


相当 于 求 出 log PLDIT]+log PIT] 的 最 大 值 。 在 这 两 项 中 ， 第 一 项 是 似 然 度 的 对 数 ， 


衡量 的 是 到 





E 论 或 模型 解释 数据 的 能 力 ， 而 第 二 项 是 先 验 概率 的 对 数 。 


这 个 先 验 概率 相当 于 可 以 用 于 正则 化 的 一 项 。 更 神奇 的 是 ， 不 同 参 数 的 先 验 
概率 之 和 为 1 这 个 要 求 会 让 我 们 希望 参数 遵循 的 概率 分 布 满足 某 些 性 质 ， 即 当 参 
数值 变 大 时 ， 相 应 概率 应 该 呈 指 数 递减 ， 趋 向 于 0。 这 就 变 成 了 某 些 常用 的 正则 化 
方法 ! 正则 化 因此 可 以 被 看 作 贝 叶 斯 公式 的 推论 ”! 

更 妙 的 是 ， 无 论 是 在 不 确定 性 集合 还 是 在 正则 化 中 ， 所 有 看 似 随 意 的 超 参 数 


实际 上 都 证 明了 在 寻找 可 信 模 型 时 先 验 置信 度 的 不 可 避免 性 

















或 者 说 有 效 性 ! 














正则 化 很 有 用 ， 因 为 它 会 迫使 我 们 引入 偏见 。 然 而 我 们 之 前 已 经 看 到 ,偏见 正 是 
理性 的 支柱 之 一 。 

但 纯粹 贝 叶 斯 主义 者 会 在 正则 化 与 稳健 优化 的 应 用 方法 中 看 到 欠缺 之 处 。 大 
部 分 机 器 学 习 算法 最 终 会 得 出 唯一 一 个 模型 ， 只 会 选择 唯一 一 个 理论 T 然而 ， 集 
成 学 习 或 者 自助 投票 等 方法 引导 我 们 将 不 同 的 机 器 学 习 算 法 结合 起 来 ， 尤 其 是 可 
以 利用 Adaboost 等 技巧 。 这 是 因为 ， 这 些 方法 说 明 如 果 在 优秀 理论 之 间 取 平均 值 
的 话 ， 通 常 得 到 的 结果 要 比 其 中 最 优秀 的 理论 还 要 好 ， 因 为 这 是 对 抗 过 度 拟 合 的 






























































(D LASSO 实际 上 也 相当 于 假设 先 验 分 布 是 我 们 在 第 8 章 看 到 的 拉 普 拉 斯 分 布 ! 
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绝 佳 办 法 。 互 不 相 容 的 模型 组 成 的 森林 要 比 其 中 每 一 棵 树 更 寄 智 03。 

举 个 例子 ， 当 网 飞 ( Netflix ) 举办 奖金 为 100 万 美元 的 机 器 学 习 大 赛 时 ， 最 
优秀 的 胜利 者 考虑 了 800 个 不 同 模型 的 平均 值 0 ! 然而 ,计算 最 优秀 模型 的 平均 
值 正 是 贝 叶 斯 公式 的 要 求 ! 

许多 研究 人 员 已 经 意识 到 了 这 一 点 。 例 如 在 2016 4E, Wk + 加 尔 发 表 了 他 的 
博士 论文 《深度 学 习 中 的 不 确定 性 》(“Uncertainty in Deep Learning”)， 加 尔 在 其 
中 证 明了 机 器 学 习 中 的 大 量 常用 技巧 都 可 以 用 贝 叶 斯 主义 的 语言 重新 诠释 。 我 们 
刚才 说 到 的 随机 失 活 正 是 这 种 情况 ! 这 是 因为 每 一 组 失 活 神经 元 都 对 应 着 一 个 模 
型 。 因此， 整个 神经 网 络 的 预测 可 以 通过 取 不 同 模型 预测 的 平均 值得 到 ， 其 中 每 
一 个 模型 都 可 以 由 一 组 失 活 神经 元 得 出 。 































































































只 有 贝 叶 斯 推断 才 是 可 容许 的 > 


甚至 有 一 个 定理 强调 了 偏见 的 重要 性 :“ 没 有 免费 午餐 ”定理 。 简 单 地 说 ， 这 
个 定理 断言 不 存在 最 好 的 机 器 学 习 算法 。 更 准确 地 说 ， 无 论 你 用 什么 办 法 来 选择 
模型 ， 都 存在 这 样 的 问题 ， 你 的 方法 会 在 这 种 问题 上 面 被 其 他 方法 超越 ， 而 这 些 
其 他 方法 一 般 会 利用 适当 的 先 验 置 信 度 。 

与 “没有 免费 午餐 ”定理 互补 的 另 一 定理 关心 的 则 是 统计 决策 论 中 贝 叶 斯 推 
断 的 可 容许 性 。 想 象 一 下 ， 现 在 有 某 一 项 你 不 知道 的 基础 信息 9， 但 你 接收 到 了 与 
0 相关 “的 一 项 信息 x。 现 在 你 必须 做 出 一 项 决策 , 而 这 项 决策 的 效果 取决 于 9。 当 
然 ， 你 的 决策 可 以 与 x 相关 。 你 现在 还 是 不 知道 9 是 什么 , 但 我 们 假设 如 果 0 是 
已 知 的 ， 你 就 会 知道 什么 样 的 信息 x 在 等 着 你 。 你 应 该 做 出 什么 决策 ? 

在 贝 叶 斯 式 的 方法 中 ， 你 首先 会 注意 到 自己 知道 Pio] 是 多 少 。 然 而 ， 你 
不 知道 9 的 值 。 怎 么 办 ? 当然 要 利用 偏见 ! 贝 叶 斯 主义 者 会 考虑 某 个 先 验 置 信和 度 
P[9]， 然 后 进行 贝 叶 斯 推断 来 确定 PO] 的 值 。 现 在 他 既然 知道 了 9 可 能 的 值 ， 就 
可 以 最 优化 自己 的 决策 了 。 














































































































(D 事实 上 ,这 并 不 是 必要 的 假设 。 
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贝 叶 斯 推断 可 容许 性 定理 正 是 如 此 断言 的 ， 无论 你 的 决策 机 制 如 何 ， 无 论 贝 
叶 斯 主义 者 的 偏见 是 什么 ， 都 存在 未 知 信息 9 的 某 个 取 值 ， 使 得 贝 叶 斯 主义 者 会 
得 到 比 你 更 好 的 结果 “。 因 此 我 们 说 贝 叶 斯 主义 的 方法 是 可 容许 的 。 当 然 ， 这 不 是 
在 说 这 个 方法 比 你 的 方法 更 好 ， 这 都 要 取决 于 0 的 值 。 

但 这 个 可 容许 性 定理 最 令 人 着 迷 的 并 不 是 这 个 方面 。 它 同样 证 明了 ， 在 某 些 
合理 的 额外 假设 下 ， 无 论 你 采用 什么 决策 机 制 ， 都 存在 某 位 持 有 特定 偏见 PLO] 的 
贝 叶 斯 主义 者 ， 无论 9 取 什么 值 ， 他 的 决策 至 少 跟 你 的 一 样 好 ， 其 至 比 你 的 更 
好 ! 换 句 话说 ， 所 有 可 容许 的 决策 机 制 组 成 的 集合 正 是 所 有 贝 叶 斯 方法 组 成 的 集 
合 5。 所 有 非 贝 叶 斯 的 替代 方案 都 会 处 处 劣 于 某 个 贝 叶 斯 方法 ! 

























































































奥 卡 姆 剃刀 来 自 贝 叶 斯 主义 ! 








我 们 最 后 来 到 我 对 贝 叶 斯 公式 的 沉思 中 最 为 愉悦 的 时 刻 之 一 。 我 在 午饭 时 间 
走 进 了 瑞士 洛桑 联邦 理工 学 院 的 同事 的 办 公 室 ， 两 位 同事 当时 正在 讨论 奥 卡 姆 学 
习 这 个 概念 ， 它 与 奥 卡 姆 剃刀 关系 密切 。 于 是 我 开始 思考 奥 卡 姆 剃刀 的 贝 叶 斯 诠 
释 问 题 。 贝 叶 斯 公式 有 没有 可 能 蕴含 了 奥 卡 姆 剃刀 ? 

考虑 用 于 描述 理论 的 某 个 语言 ， 这 个 语言 可 以 是 法 语 、 数 理 罗 辑 或 者 计算 机 
编程 语言 。 于 是 ， 每 个 理论 都 可 以 用 这 个 语言 中 的 ( 可 能 非常 长 的 ) 一 句 话 来 描 
述 ， 即 由 该 语言 的 符号 组 成 的 有 限 序 列 。 令 T, 为 所 有 可 以 用 个 符号 组 成 的 句子 
描述 的 理论 组 成 的 集合 。 为 了 与 贝 叶 斯 主义 相 容 ， 这 些 理 论 的 先 验 置信 和 度 应 令 n 
个 符号 对 应 的 所 有 理论 的 总 和 置信 度 P[7,] 对 于 所 有 的 总 和 等 于 1。 也 就 是 说 ， 
贝 叶 斯 主义 要 求 以 下 条 件 必须 成 立 : 



















































































PIT, ]+P[T.]+P[T;]+P[T] + =1 

但 是 ， 每 个 P[7,] 的 值 都 是 正 数 ， 这 里 有 无 数 个 这 样 的 值 。 于 是 ， 无 穷 级 数 
理论 告诉 我 们 ， 如 果 这 些 正 数 项 的 无 穷 求 和 是 有 限 的， 那么 这 个 求 和 中 的 每 一 项 
P[7,] 必然 随 着 n 的 增 大 变 得 任意 小 。 这 个 想法 突然 划 过 我 的 脑海 ， 我 立刻 凑 近 白 




















© 除非 你 的 决策 总 是 跟 贝 叶 斯 主义 者 选择 的 决策 一 样 好 。 
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B. SFT 


Y P[T,] «5 lim P[7,]=0 


但 写 下 这 个 公式 相当 于 说 需要 更 多 符号 来 描述 的 理论 会 拥有 更 低 的 先 验 置信 和 度 ! 
贝 叶 斯 公式 蕴含 了 奥 卡 姆 剃刀 ! 

贝 叶 斯 公式 甚至 能 走 得 更 远 ， 向 我 们 精确 指出 了 拥有 更 长 描述 的 理论 在 何 种 程 
度 上 更 不 可 信 。 这 是 因为 个 符号 对 应 的 理论 总 数 会 随 着 二 指数 增长 ， 从 中 我 们 
可 以 得 出 某 个 需要 nn 个 符号 来 描述 的 理论 ， 它 的 先 验 置信 和 度 会 随 着 指数 下 降 ! 
换 句 话说， 更 复杂 的 理论 因此 并 不 只 是 置信 度 更 低 ， 而 是 置信 度 会 指数 下 降 ! 

我 被 这 个 甘美 的 发 现 慑 服 了 一 一 而 我 当时 还 没有 直到 所 罗 门 诺 夫 妖 。 这 个 发 
现 不 仅 巩固 了 贝 叶 斯 公式 ， 而 且 让 我 们 揭 开 了 奥 卡 姆 剃刀 能 被 广泛 接受 的 秘密 。 
对 于 纯粹 贝 叶 斯 主义 者 来 说 ， 奥 卡 姆 剃刀 并 不 是 需要 努力 接受 的 哲学 原则 ， 而 是 
贝 叶 斯 范式 中 的 一 个 数学 定理 。 





































































































、 该 死 的 谎言 和 统计 数据 。 
- 迪 斯 雷 利 (1804—1881 ) 
政客 使 用 统计 方法 就 像 醉 鬼 使 用 电灯 柱 : 不 
是 为 了 光明 ， 而 是 为 了 支撑 。 
DUAE + 库 恩 (1919 一 2012 ) 


第 全 音 
真相 在 撤 谎 


公立 医院 还 是 私人 诊所 ? 
你 病 得 很 重 。 经 过 一 点 研究 之 后 ， 你 发 现 对 于 自己 的 疾病 来 说 ， 你 在 公立 医 
院 的 存活 率 是 50%， 而 在 私人 诊所 的 存活 率 能 达到 80%。 你 应 该 选择 去 私人 诊所 
而 不 是 公立 医院 ， 不 是 吗 ? 
这 是 当然 ! 

不 要 那么 急 。 经 过 更 多 搜索 之 后 ， 你 发 现 了 一 些 统计 数据 ， 其 中 区 分 了 两 类 
病人 : 普通 是 者 的 存活 率 是 90%, 
这 还 不 错 ; 然而 在 公立 医院 中 ， 这 些 普通 患者 的 存活 率 是 100%。 男 一 方面 ， 大 多 
数 危 重 患者 会 死亡 ， 但 公立 医院 仍然 能 设法 拯救 其 中 40% 的 患者 ， 比 起 只 能 拯救 
10% 的 危重 患者 的 私人 诊所 来 说 要 好 上 不 少 。 

现在 我 们 先 思考 几 分 钟 。 这 里 发 生 了 一 些 极其 古怪 的 事情 。 无 论 是 救治 普通 患 
者 还 是 救治 危重 患者 ， 公 立 医院 都 比 私人 诊所 好 得 多 ， 然 而 总 体 而 言 ， 表 现 更 好 的 




















者 与 危重 患者 。 一 方面 ， 在 私人 诊所 中 ， 普 通 患 
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却 是 私人 诊所 ! 这 怎么 可 能 ? 既然 每 位 患者 在 公立 医院 的 预后 都 比 在 私人 诊所 好 ， 
那么 私人 诊所 的 总 痊愈 率 怎么 会 比 公 立 医 院 更 高 ? 应 该 到 哪里 就 医 ? 请 你 暂停 一 下 ， 
花 点 时 间 思 考 这 些 问 题 。 

你 可 能 觉得 有 些 困 惑 ， 但 你 要 知道 这 完全 是 正常 现象 。 我 刚才 利用 虚构 的 数 
字 向 你 介绍 的 正 是 辛普森 悖 论 ， 这 个 悖 论 极 具 破坏 性 。 比 起 其 他 悖 论 ， 它 更 尖锐 
地 指出 了 统计 数字 可 能 产生 惊人 的 误导 ， 而 对 统计 的 分 析 需 要 艰苦 的 脑力 劳动 以 
及 丰富 的 专业 素养 。 不 笠 的 是 ， 这 样 的 专业 素养 极端 罕见 ， 而 在 统计 的 诠释 
“ 半 桶 水 ”的 思考 什么 也 算 不 上 。 

拉 里 : 沃 瑟 曼 在 他 的 统计 学 课本 中 写 道 ， 这 个 悖 论 “ 对 于 很 多 人 来 说 非常 嫩 
手 ， 其 中 包括 那些 接受 过 良好 教育 的 统计 学 家 ”。 科 普 视频 频道 Science Etonnante 
的 达 维 德 ， 卢 阿 普尔 在 有 关 这 个 主题 的 视频 品 的 开头 就 打 了 个 赌 :“ 我 确信 你 一 旦 
看 了 这 个 视频 ， 就 不 会 再 用 以 前 的 眼光 来 看 待人 们 展示 的 统计 数据 了 。” 

如 果 我 写 的 对 你 来 说 够 清楚 的 话 ， 那 么 本 章 应 该 会 颠覆 你 诠释 统计 结果 的 方 
法 。 克 制 、 慎 重 和 谦虚 应 该 会 成 为 关键 词 一 一 而 我 希望 之 前 的 章节 已 经 足以 鼓励 
你 做 出 这 样 的 反应 。 尤 其 要 记 住 的 是 ， 表 面 上 正确 且 合乎 规范 的 统计 数据 实际 上 
几乎 远 远 不 成 定论 ， 而 且 比 人 们 靠 直觉 所 相信 的 更 不 能 作为 结论 。 
理解 辛普森 悖 论 的 钥匙 是 被 称 为 “混杂 因素 ”的 概念 。 存 上面 的 情况 中 ,， 混 
杂 因 素 就 是 患者 就 诊 时 的 身体 状况 。 如 果 说 私人 诊所 的 存活 率 比 公立 医院 高 ， 那 
不 过 是 因为 私人 诊所 的 患者 在 就 诊 时 健康 状况 更 好 。 因 此 ， 私 人 诊所 的 80% 存活 
率 对 应 的 基本 上 就 是 普通 患者 的 存活 率 ， 而 反 过 来 说 ,公立 医院 的 50% 存活 率 如 
此 低 ， 那 是 因为 它 基 本 上 对 应 的 是 危重 患者 的 存活 率 。 

我 一 直 以 来 觉得 辛普森 悖 论 并 不 是 悖 论 ， 或 者 说 它 其 实 很 平常 。 只 要 将 数据 
列表 填 好 ， 就 不 难看 出 公立 医院 对 于 每 种 患者 来 说 都 更 好 ， 以 及 为 什么 私人 诊所 
在 整体 上 仍然 能 获得 更 好 的 统计 数据 。 然 而 ,辛普森 悖 论 指 出 的 困难 之 处 并 非 
在 填 好 数据 表 之 后 用 数学 来 解决 问题 ,真正 的 问题 在 于 ， 在 实际 中 通常 只 能 获得 
50% 和 80% 这 些 数字 。 但 我 们 真 的 希望 得 出 结论 ! 更 糟糕 的 是 ,我们 即使 花 时 间 
去 思考 ,通常 也 很 难 意识 到 正确 的 混杂 因素 ， 从 而 避 开 辛普森 悖 论 这 个 陷阱 PL 

在 任何 情况 下 ,我 们 必须 抗拒 做 出 结论 的 诱惑 。 艾 带 安 . 克 莱 因 曾 这 样 反 复 
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说 过 :“ 要 尽量 避免 得 出 结论 。 


相关 并 非 因果 


学 术 期 刊 《新 英格兰 医学 期 刊 》( The New England Journal of Medicine) 在 
2012 年 曾 发 表 过 一 篇 短文 ， 名 为 《巧克力 消费 、 认 知 能 力 与 诺 贝尔 奖 得 主 》 
( *Chocolate Consumption, Cognitive Function, and Nobel Laureates”)。 这 篇 文章 指 
出 ， 食 用 巧克力 对 于 智力 有 正面 影响 。 这 个 惊人 的 断言 来 自 不 同 国家 的 (人 均 ) 
巧克力 消费 量 以 及 (人 均 ) 诺 贝 尔 奖 获 得 次 数 之 间 极 其 清晰 的 相关 性 。 描 述 这 一 
相关 性 的 图 表 很 快 就 传 遍 了 整个 互联 网 。《 费 加 罗 报 》 也 发 表 了 一 篇 文章 《了 吃 巧 克 
力 ， 得 诺 贝 尔 奖 》(“Croquez du Chocolat pour Avoir le Nobel" ). 

但 是 ,“ 要 尽量 避免 得 出 结论 ”。 相 关 性 绝对 无 法 证 明 原 因 与 结果 之 间 的 联系 。 
因此 ， 即 使 不 能 否定 巧克力 对 智力 的 影响 ， 我 也 很 肯定 还 有 别 的 方法 能 更 好 地 解 
释 不 同 国家 的 巧克力 消费 量 与 诺 贝尔 奖 获得 次 数 之 间 的 相关 性 。 我 请 你 也 思考 一 
下 这 个 问题 。 

当政 客 、 激 进 分 子 和 律师 出 于 自身 利益 选择 统计 数据 时 ， 这 些 数 据 的 问题 就 
会 变 得 特别 麻烦 。 这 是 因为 ， 用 操纵 混杂 因素 的 方法 一 般 来 说 都 可 以 搜 乔 到 表面 
上 看 似 支持 某 个 政治 立场 的 统计 数据 。 正 如 温 斯 顿 丘吉尔 所 说 :“ 当 我 要 求 得 到 
新 生 儿 死亡 率 的 统计 数据 时 ， 我 想 要 的 是 一 个 证 明 , 证 明 在 我 当 首相 时 天 折 的 婴 
儿 比 任何 其 他 人 当 首相 时 都 要 少 。 这 就 是 政治 中 的 统计 。” 

举 个 例子 ， 有 个 现象 非常 奇怪 ， 而 且 时 常 出 现 : 在 警力 增加 之 后 ， 犯 罪 率 也 
会 增加 ， 就 好 像 打击 犯罪 会 不 可 避免 地 鼓励 犯罪 那样 。 这 样 的 相关 性 会 暗示 增加 
纪律 部 队 预 算 这 个 想法 不 可 行 。 电 视 上 会 这 样 报道 : “惩戒 没有 用 处 。” 然 而 我 们 要 
意识 到 ， 这 个 结论 依靠 的 是 对 统计 数字 的 错误 阐述 ， 因 为 还 有 另 一 个 更 简单 的 方 
法 可 以 解释 这 个 相关 性 : 警力 增加 之 后 ， 警 察 巡 逻 的 频率 也 会 增加 ; 犯罪 分 子 可 能 
没有 增加 ， 但 的 确 有 更 多 的 犯罪 分 子 被 警察 逮捕 了 ， 因 此 犯罪 率 必 然 增 加 。 

同样 ， 如 果 我 们 让 更 多 人 负担 得 起 医学 诊断 的 费用 ， 那 必定 会 发 现 更 多 病人 。 
因此 ， 医 疗 手段 的 改善 通常 会 导致 患者 数量 的 增加 ! 我 们 也 可 以 用 这 个 方法 解释 
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注射 过 疫苗 的 孩子 与 自 闲 症 之 间 的 相关 性 。 注 射 过 疫苗 的 孩子 会 得 到 更 好 的 健康 
监测 ， 如 果 他 们 上 患 有 自 闭 症 ， 那 么 病情 很 可 能 会 被 诊断 出 来 。 反 过 来 说 ， 因 为 没 
有 注射 疫苗 却 患 上 自 闭 症 的 孩子 通常 没有 得 到 健康 监测 ， 所 以 他 们 的 自 闭 症 很 有 
可 能 不 会 被 诊断 出 来 。 

这 里 的 情况 就 是 所 谓 的 选择 偏差 、 幸 存 者 偏差 或 者 说 淘汰 偏差 一 一 所 有 这 些 
情况 事实 上 都 是 某 种 达尔 文 式 演 化 。 统 计数 字 揭 示 的 实际 上 更 偏向 于 获得 统计 的 
方式 ， 而 不 是 因果 联系 。 要 避免 任何 曲解 的 话 ， 正 确 理解 我 们 面前 的 这 些 统计 数 
字 是 非常 重要 的 。 犯 罪 率 揭示 的 并 不 是 犯罪 人 数 ， 而 是 那些 被 抓获 的 犯罪 分 子 的 
数目 。 同 样 ， 自 闭 症 的 统计 数字 是 那些 被 诊断 出 来 的 患者 数量 ， 而 不 是 实际 的 自 
闭 症 患 者 数量 。 要 注意 这 些 模 糊 之 处 1 

里 然 这 样 说 ,但 巧克力 消费 量 和 诺 贝 尔 奖 获得 次 数 之 间 的 相关 性 似乎 并 不 属 
于 选择 偏差 。 我 们 来 寻找 一 下 相关 性 的 男 一 种 合理 解释 。 给 定 4 和 8 之 间 的 相关 
性 ， 人 们 会 倾向 于 认为 是 4 引起 了 B。 BEKE, 4 和 B 之 间 的 相关 性 这 个 概念 
是 完全 对 称 的。 如 果 4 与 相关， 那么 B 也 与 4 相关。 所 以 ， 某 个 相关 性 的 解释 
可 能 只 是 把 人 们 希望 得 出 的 因果 关系 倒 过 来 而 已 。 

例如 ， 高 水 平 的 运动 员 通 常 是 那些 热爱 竞赛 的 人 。 我 们 可 能 会 认为 运动 能 力 
达到 非常 高 的 水 平 之 后 ， 运 动员 就 会 产生 竞争 意识 ， 刺 激 对 绪 得 大 奖 的 渐 户 
这 可 能 有 些 道理 。 然 而 ， 最 简单 的 解释 可 能 是 竞赛 意识 不 足 的 运动 员 不 会 足够 投 
入 ， 因 此 达 不 到 非常 高 的 水 平 。 正 是 竞争 意识 让 运动 员 能 够 达到 高 水 平 。 

我 们 在 许多 情况 中 也 能 看 到 这 个 效应 。 举 个 例子 ， 千 权 的 政客 通常 有 一 种 对 
权力 的 渴望 ， 一 流 数 学 家 对 数学 的 优美 有 着 深刻 的 赞赏 ， 登 上 头条 的 新 闻 通 常 特 
别 跌宕 起 伏 、 引 人 入 胜 。 在 所 有 这 些 情 况 中 ， 相 关 性 的 解释 其 实 就 是 政客 、 数 学 
家 和 新 闻 头 条 都 经 过 了 系统 性 的 选择 或 者 淘汰 。 

另 一 个 例子 就 是 大 型 活动 中 警察 人 数 众多 与 发 生 大 量 事故 的 相关 性 。 并 不 是 
警察 在 场 导 致 了 事故 ， 而 是 发 生 事故 的 风险 很 高 才 导 致 了 大 量 警 察 到 场 。 在 所 有 
这 些 例 子 之 中 ， 相 关 性 并 不 能 说 明 4 导致 3， 反 而 可 能 说 明 B 导致 了 4。 

但 是 拥有 诺 贝尔 奖 如 何 会 导致 巧克力 消费 量 上 升 ， 这 一 点 并 不 清楚 。 为 了 理 
解 这 一 相关 性 ， 我 们 转 到 另 一 个 奇怪 的 相关 性 上 : 工作 时 在 室外 休息 会 降低 预期 
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寿命 。 即 使 没有 进行 具体 研究 ， 我 也 很 乐意 打赌 这 个 相关 性 在 统计 学 上 是 显著 的 。 
为 什么 呢 ? 请 你 在 读 下 去 之 前 花 一 点 时 间 思 考 一 下 。 

这 个 相关 性 实际 上 可 以 用 其 中 两 个 变量 的 共同 原因 来 解释 ， 那 就 是 吸烟 。 这 
是 因为 在 工作 时 ,吸烟 者 往往 会 比 非 吸 烟 者 花 上 更 多 时 间 在 室外 休息 。 然 而 ， 吸 
烟 是 肺癌 的 主要 原因 。 因 此 ， 在 室外 花 上 更 多 时 间 休 息 的 人 就 是 那些 吸烟 者 ， 他 
们 更 有 可 能 患 上 肺癌 ， 从 而 可 能 在 更 年 轻 的 时 候 死亡 。 所 以 这 个 相关 性 可 以 通过 
共同 原因 来 解释 。 

巧克力 消费 量 和 庇 贝 尔 奖 获 得 次 数 之 间 的 相关 性 是 不 是 这 种 情况 呢 ? 是 不 是 
存在 某 些 因素 会 使 某 些 国家 消费 更 多 巧克力 ， 同 时 也 会 使 这 些 国家 获得 更 多 诺 贝 
尔 奖 ? 非常 有 可 能 。 其 实 ， 那 些 消费 更 多 巧克力 并 获得 更 多 诺 贝 尔 奖 的 国家 都 是 
发 展 程度 非常 高 的 国家 。 这 些 国家 的 居民 享受 着 极 高 的 生活 质量 ， 消 费 大 量 奢 侈 
品 ， 也 拥有 著名 的 大 学 。 所 以 ， 我 们 考虑 的 相关 性 在 这 里 也 可 以 通过 共同 原因 来 
解释 ， 那 就 是 财富 。 人 们 会 说 财富 是 一 个 能 解释 巧 元 力 消费 量 和 诺 贝尔 奖 获 得 次 
数 之 间 的 相关 性 的 混杂 因素 91 CET 13.1 )。 
















































































图 13.1 巧克力 消费 量 与 诺 贝尔 奖 获得 次 数 之 间 的 相关 性 可 以 通过 财富 这 一 混杂 因素 来 解 
释 ， 它 同时 推动 了 巧克力 的 消费 以 及 诺 贝尔 奖 的 获得 。 这 个 图 示 也 对 应 着 一 个 贝 
叶 斯 网 络 。 我 们 在 第 17 章 会 再 提 到 这 个 话题 
识别 正确 的 混杂 因素 可 能 是 统计 学 中 最 困难 的 任务 。 到 现在 为 止 ， 我 们 看 到 
的 例子 都 相对 简单 。 但 混杂 因素 有 时 候 更 微妙 且 难 以 捉摸 。 








寻找 混杂 因素 





比如 ， 根 据 一 个 出 色 的 Ted-Ed 视频 外 所 说 ， 英 国 的 一 项 研究 表明 ,在 20 年 
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内 ,存活 的 吸烟 者 比 非 吸烟 者 更 多 。 这 样 的 研究 有 可 能 会 被 那些 受 烟 草 业 资 助 的 








政客 或 律师 一 次 又 一 次 地 强调 。 这 些 统计 数字 本 身 可 能 没有 什么 可 指 








责 的 地 方 ， 





但 问题 在 于 怎么 解释 这 些 数字 。 我 们 尤其 绝对 不 能 从 中 得 出 “烟草 有 益 身 体 ” 的 








结论 。 为 什么 呢 ? 因为 其 中 有 一 个 重要 的 混杂 因素 。 你 能 看 出 来 吗 ? 


这 个 视频 举 的 另 一 个 例子 就 是 美国 佛罗里达 州 的 死刑 。 有 关 种 族 主 义 针 对 黑 





人 的 辩论 在 美国 引发 群情 激昂 




















"Black Lives Matter” 运 动 就 是 例证 。 因 此 人 们 


对 佛罗里达 州 的 死刑 进行 了 统计 研究 。 黑 人 嫌疑 犯 是 否 更 有 可 能 被 判 极刑 ? 统计 数 
字 指 出 并 非 如 此 ， 而 一 位 否定 种 族 不 平等 的 政治 候选 人 很 快 就 开始 强调 这 项 研究 。 

然而 这 里 存在 一 个 混杂 因素 : 受害 者 的 肤色 。 因 为 罪犯 与 受害 考 通 常 拥有 相 
同 的 肤色 ， 所 以 黑人 嫌疑 犯 更 经 常 被 控 谋 杀 黑 人 受害 者 ， 而 白人 嫌疑 犯 则 更 经 常 























被 控 谋 杀 白 人 受害 者 。 然 而 ， 给 定 嫌 疑犯 的 肤色 ,法官 会 在 受害 者 是 














人 的 情况 


下 更 宽大 。 反 过 来 说 ， 给 定 受 害 者 的 肤色 ， 黑 人 嫌疑 犯 实际 上 明显 比 和 白人 嫌疑 犯 
更 经 常 被 判 死 刑 。 这 就 是 那些 抱怨 司法 中 种 族 不 平等 的 候选 人 所 强调 的 统计 数据 。 

在 《科学 》( Science ) 期 刊 博客 的 某 一 集中 外， 犯罪 学 研究 者 安 德 烈 . 库 恩 同 
样 断 言 ， 在 绝 大 部 分 国家 ,外 国人 中 犯罪 者 的 比例 要 比 本 地 人 更 高 的 这 个 事实 同 
样 只 是 辛普森 悖 论 导致 的 有 偏差 的 统计 数字 。 安 德 烈 . 库 恩 表明 ， 如 果 年 龄 、 性 
别 和 社会 经 济 地 位 相等 的 话 ， 那 么 外 国人 是 犯罪 者 的 先 验 可 能 性 实际 上 跟 本 地 人 


























相同 。 

















与 某 些 政客 的 弦 外 之 音 不 同 ， 外 国人 群 与 本 地 人 和 群 在 统计 数据 上 有 差异 ， 并 
非 因为 外 国人 与 本 地 人 的 本 性 有 着 根本 的 差异 。 库 恩 的 分 析 表 明 ， 这 一 差异 实际 
上 来 自 两 个 群体 在 人 口 统计 上 的 差异 : 外 国人 更 多 是 没什么 财产 的 年 轻 男 性 ， 而 




















与 之 相 比 ， 本 地 人 相对 来 说 更 可 能 是 富有 的 年 老 女性 。 在 这 个 思考 的 指引 下 ， 那 


些 看 似 应 该 不 利于 外 国人 的 统计 数据 就 变 得 完全 无 关 紧 要 了 1 


目前 为 止 我 们 看 到 了 不 少 例子 ， 现 在 我 们 回 到 吸烟 者 的 例子 。 你 知道 怎么 确 





定 那个 能 解释 吸烟 者 存活 率 更 高 的 混杂 因素 了 吗 ? 


请 你 在 阅读 这 本 书 时 的 休息 间隔 中 多 花 些 时 间 来 思考 这 个 问题 。 由 此 你 可 以 
感受 到 自己 有 多 无 知 ， 还 有 在 辛普森 导论 的 影响 下 诠释 统计 数字 有 和 多 困难 。 
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回归 平均 


我 们 现在 继续 寻找 那些 不 明显 的 混杂 因素 。 以 色 列 空军 的 教官 观察 到 ， 被 批 
评 的 飞行 员 之 后 会 明显 进步 ; 然而 令 教官 大 跌眼镜 的 是 ， 那 些 被 表扬 的 飞行 员 之 
ERAH. RPM, SEU PAR SITES, ill PCR CE 
FE FRE! 教官 应 该 批评 还 是 表扬 ? 

然而 ,不 同 的 科学 研究 表明 ， 与 前 面 的 说 法 正好 相反 ， 在 教育 上 奖励 比 惩罚 
更 有 效 。 因 此 “所 有 教育 者 可 能 都 认为 鼓励 对 学 习 有 害 ” 这 种 想法 是 错误 的 。 实 
际 上 到 底 如 何 ” 科 学 共同 体 犯错 了 吗 ? 或 者 说 空军 教官 提出 的 经 验 结论 中 是 否 存 
在 某 些 混杂 因素 ? 

要 避免 辛普森 悖 论 这 一 陷阱 ， 纯 粹 贝 叶 斯 主义 者 的 偏见 是 不 可 或 缺 的 “>。 思 
的 时 候 不 利用 偏见 ， 或 者 不 引用 数据 以 外 的 模型 ， 就 相当 于 把 自己 的 脚 绑 起 来 ， 
然后 跳 进 混杂 因素 的 陷阱 ! 我 们 之 前 也 看 到 ， 公 立 医 院 和 私人 诊所 之 间 存 在 天 然 
的 差异 (患者 就 诊 时 的 身体 状况 )， 而 外 国人 和 本 地 人 之 间 也 是 这 样 (年龄 、 性 别 
与 社会 经 济 地 位 )， 白 人 嫌疑 犯 与 黑人 嫌疑 犯 之 间 同 样 如 此 (受害 者 的 肤色 ) 受 
批评 的 飞行 员 和 受 鼓 励 的 飞行 员 之 间 会 不 会 也 有 某 种 天 然 的 差异 呢 ? 

当然 有 ! 那些 受 批评 的 飞行 员 之 所 以 受 批评 ， 是 因为 他 们 之 前 的 表现 特别 差 ; 
而 那些 受 表扬 的 飞行 员 之 所 以 受 表扬 ， 是 因为 他 们 之 前 的 表现 特别 好 。 然 而 ， 飞 
行 员 如 果 某 天 犯错 了 ， 第 二 天 可 能 就 不 会 再 犯 ， 无 论 他 有 没有 被 批评 。 同 样 ， 那 
些 在 某 天 立 下 出 色 功 绩 的 飞行 员 ， 第 二 天 要 重复 做 到 这 一 点 可 能 很 困难 四。 

我 们 刚才 揭示 的 现象 正 是 辛普森 悖 论 的 一 个 特殊 情况 ， 有 些 人 也 将 它 叫 作 回 
归 平 均 。 我 们 可 以 用 “ 雨 过 天 晴 ” 这 个 成 语 来 概括 这 种 现象 。 如 果 今 天 的 天 气 特 
别 糟糕 ,那么 明天 天 气 更 糟糕 的 概率 就 很 小 ， 因 为 今天 的 天 气 作为 与 明天 天 气 比 
较 的 基准 来 说 本 来 就 非常 糟糕 了 。 反 过 来 说 ， 齐 达 内 的 儿子 们 也 不 大 可 能 超越 他 
的 水 平 ( 即使 我 希望 他 们 做 得 到 )， 因 为 跟 他 们 比较 的 基准 本 来 就 是 一 位 出 众 的 球 
星 。 这 个 现象 也 解释 了 为 什么 肩负 整顿 异常 恶劣 状态 的 重任 的 政府 官员 很 有 可 能 





































































































































































































中 ”尤其 是 在 尝试 解释 PIBA] 7 PIB dE A] 时 ， 我 们 会 尝试 确定 某 些 可 供 援 引 的 特征 Z， 它 必须 
S P[Z|4] 和 PP[Z| 非 4] 之 间 有 着 巨大 差距 ,并且 使 Pp[B|4, Z] = IPS] HE 4, Zlo 
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得 以 胜利 摆脱 困境 一 一 无 论 他 们 有 没有 采取 应 对 措施 。 


斯 坦 悖 论 





1955 年 ， 查 尔 斯 ， 斯坦 发 现 了 回归 平均 问题 的 一 个 神秘 解法 。 想 象 你 必须 根据 
飞行 员 的 表现 估计 他 们 的 水 平 。 从 直觉 上 来 说 ， 我 们 可 能 会 高 估 表 现 更 好 的 飞行 员 ， 
也 可 能 低估 在 展示 时 策 手 第 脚 的 飞行 员 。 我 们 能 否 避 开 辛 普 森 导论 这 个 陷阱 呢 ? 
斯 坦 做 出 了 肯定 的 回答 。 与 其 单纯 只 衡量 飞行 员 的 表现 ， 不 如 同时 利用 个 体 
表现 与 整体 表现 ， 这 样 的 话 ， 我 们 确实 可 以 更 好 地 估计 飞行 员 的 水 平 。 这 就 是 人 
们 所 说 的 斯 坦 悖 论 "。 这 有 点 令 人 吃惊 利用 其 他 人 的 表现 怎么 可 能 改进 有 关 某 位 
特定 飞行 员 的 预测 结果 
其 实 斯 坦 迟 论 比 这 种 说 法 更 奇怪 。 斯 坦 悖 论 同 样 指出 ， 结 合 不 同 飞行 员 水 平 、 
不 同 国家 巧克力 消费 量 以 及 不 同 医院 病人 存活 率 的 朴素 估计 ， 就 确实 能 更 好 地 佑 
计 所 有 这 些 指标 ! 其 中 非常 神秘 的 地 方 在 于 ， 这 种 对 佑 计 值 的 改善 必然 存在 ， 即 
使 飞行 员 水 平 、 巧 克 力 消费 量 和 存活 率 的 计量 单位 完全 不 相 容 ! 

这 一 点 让 人 无 比 困惑 ， 也 非常 违反 直觉 。 即 使 这 三 个 参数 之 间 绝 对 没有 任何 
因果 联系 ， 即 使 这 些 参数 的 指标 之 间 没 有 任何 关系 ， 斯 坦 悖 论 仍 然 指 出 ， 要 佑 计 
每 一 个 参数 ， 考 虑 其 他 两 个 参数 总 会 带 来 好 处 。 也 就 是 说 ， 在 严格 的 意义 上 ， 即 
使 模型 的 可 诠释 性 得 到 了 保证 ， 但 知识 的 割裂 在 统计 上 是 不 可 容许 的 。 

跟 之 前 一 样 ， 可 以 用 贝 叶 斯 的 方式 解 开 斯 坦 悖 论 的 於 团 。 关 键 在 于 添加 一 些 
与 需要 佑 计 的 各 种 数量 相关 而 且 有 解释 能 力 的 抽象 概念 。 然 而 这 些 概念 其 实 并 不 
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D 用 形式 化 的 语言 来 说 ， 对 于 1 < i mn. 我 们 根据 平均 值 ;未 知 ( 可 以 是 巧克力 的 消费 量 或 者 医 
院 病 人 的 存活 率 ) 的 正 态 分 布 抽取 独立 随机 变量 x<- N(9. D)。 所 谓 的 〈 最 小 二 乘 ) 朴素 佑 计量 ， 


就 是 OU =x 这 个 估计 。 但 我 们 有 办 法 做 得 更 好 ， 比 如 说 利用 詹姆斯 -斯 坦 (James-Stein ) 
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iiri dn - 1-25 s. tps, nant, E OHAN, 0^ 的 均 方 误差 帮会 此 


lix Mb 





o" 的 要 小 ， 也 就 是 说 ，Vg,E[les -ol «|o - o . 我 们 说 朴素 估计 量 不 是 可 容许 
的 ， 因 为 它 比 另 一 个 估计 量 更 差 。 其 实 詹姆斯 -斯 坦 估计 量 同样 不 是 可 容许 的 ， 而 所 有 贝 叶 
斯 估计 量 都 是 可 容许 的 。 
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是 混杂 因素 ， 而 更 应 该 被 称 为 简明 因素 。 所 以 














在 确定 最 可 信 模 型 的 过 程 中 是 不 可 或 缺 的 。 

一 般 来 说 ， 我 们 通常 希望 将 不 同 的 认识 领域 区 分 开 来 。 我 们 会 将 哲学 课题 留 
给 哲学 家 ， 将 经 济 课题 留 给 经 济 学 家 ， 将 物理 课题 留 给 物理 学 家 ， 将 数学 课题 留 
难道 不 对 吗 ? 的 确 不 对 。 根 据 斯 坦 悖 论 ， 所 有 理论 的 大 统一 不 仅 是 理 
论 研 究 者 摘出 来 的 大 杂烩 ， 而 且 是 在 寻找 可 信和 模型 的 过 程 中 必须 踏 出 的 一 步 — 


给 数学 家 ， 






































贝 叶 斯 主义 作为 统一 的 知识 哲学 ， 重 要 性 就 在 这 里 。 
在 只 考虑 飞行 员 的 情况 中 ， 所 有 飞行 员 的 平均 水 平 就 是 简明 因素 的 例子 。 潜 
在 的 贝 叶 斯 模型 就 相当 于 假设 飞行 员 的 水 平等 于 平均 水 平 再 加 上 随机 涨 落 。 飞 行 

















员 的 表现 由 





正 是 一 个 贝 叶 














斯 坦 悖 论 正 是 证 明了 这 些 简明 因素 














上 是 飞行 员 的 水 平 再 加 上 另 一 个 随机 涨 落 。 实 际 上 ， 我 们 在 这 里 构造 的 














之 后 会 再 谈 到 这 个 话题 。 


无 论 如 何 ， 比 起 分 别处 理 每 位 飞行 员 情况 的 模型 ， 我 们 注意 到 前 面 所 说 的 模 





行 员 的 平均 水 平 加 入 先 验 置信 和 度 的 话 ， 贝 叶 斯 推断 就 能 
果 给 出 某 个 合理 的 先 验 置信 度 ， 这 种 贝 叶 斯 推断 就 会 给 出 类 似 斯 坦 统计 佑 计量 的 


某 种 机 制 。 














斯 网 络 ， 而 对 它 的 研究 正 处 于 众多 现代 人 工 智 能 研究 的 核心 。 我 们 

















型 拥有 远 远 更 少 的 参数 ， 因 此 它 在 理论 上 更 可 信 。 但 更 重要 的 是 ， 如 果 对 每 位 飞 


日 于 这 个 模型 。 因 此 ， 如 























也 就 是 说 ， 当 我 们 尝试 将 这 个 问题 转化 为 适 月 


奇怪 的 斯 坦 悖 论 就 消失 了 1! 


内 生 分 层 的 失效 


然而 在 今天 ， 贝 叶 斯 类 型 的 方法 在 实践 中 仍然 不 受 


























日 于 贝 叶 斯 原则 的 形式 时 ， 








青睐 。 很 多 人 更 偏爱 所 谓 


的 分 层 方 法 。 这 些 方法 就 是 将 相似 的 子 群体 区 分 开 来 ， 比 如 说 比较 年 龄 、 性 别 与 
社会 经 济 地 位 相同 的 外 国人 和 本 地 人 、 在 受害 人 肤色 相同 的 前 提 下 比较 黑人 嫌疑 
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kh 疑 人 ， 以 及 比较 年 龄 相同 的 吸烟 者 和 非 吸 烟 者 。 


然而 大 约 在 2010 年 ， 某 些 统计 学 家 开始 强调 “人 工 ” 做 出 的 分 层 选择 带 来 的 
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性 一 个 人 都 必须 衡量 自身 无 知 的 程度 ， 尤 其 是 在 
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其 专业 的 领域 中 。 
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疑难 问题 。 这 些 选择 通常 都 是 随意 做 出 的 ， 给 人 一 种 缺乏 客观 性 的 印象 一 一 即使 
对 于 贝 叶 斯 主义 者 来 说 这 种 反对 意见 毫 无 价值 ! 分 层 选 择 本 里 可 能 并 无 根据 或 者 
并 不 充分 ， 这 会 导致 错误 的 绪论。 最后， 分 层 选择 必须 进行 人 工 干预 ， 因 此 需要 
大 量 时 间 与 工作 量 。 有 没有 办 法 将 分 层 选择 自动 化 ? 内 生 分 层 就 此 诞生 。 

2015 年 ,我 在 美国 麻 省 理工 学 院 参加 了 一 个 统计 学 的 研讨 会 ， 全 世界 最 著名 的 
几 位 统计 学 家 也 在 同一 个 报告 厅 。 报 告 者 阿尔 韦 托 ' 阿 瓦 迭 花 了 不 少时 间 讨 论 报 纸 上 
的 一 篇 文章 中 ， 其 中 提 到 了 萨 拉 … 戈 德 里 克 - 拉 布 及 其 合作 者 所 完成 的 对 美国 威 斯 
康 星 州 学 生 相 关 数 据 进行 内 生 分 层 的 结果 钙 。 内 生 分 层 将 学 生 分 为 三 个 类 别 : 进入 
大 学 时 能 完成 学 业 的 可 能 性 似乎 不 大 的 学 生 、 完 成 学 业 的 可 能 性 中 等 的 学 生 ， 以 及 
很 有 可 能 完成 学 业 的 学 生 。 数 据 分 析 表 明 ， 对 于 第 一 组 学 生来 说 ， 得 到 奖学金 这 一 
事实 对 他 们 的 净 影 响 是 正面 的 。 与 那些 完成 大 学 学 业 的 可 能 性 似乎 不 大 而 且 没 有 获 
得 奖学金 的 人 相 比 ， 那 些 同 样 没什么 可 能 完成 学 业 的 奖学金 获得 者 表现 得 更 好 。 

到 此 为 止 没什么 问题 。 然 而 同一 个 内 生 分 层 分 析 也 证 明了 ， 对 于 第 三 组 学 生 ， 
也 就 是 那些 入 学 时 能 完成 学 业 的 可 能 性 很 大 的 学 生来 说 ， 获 得 奖学金 实际 上 会 产 
生 负 面 影 响 ! 这 种 情况 就 像 是 当 我 们 成 绩 不 错时 ， 如 果 有 人 给 了 我 们 更 多 的 钱 的 
话 ， 我 们 就 开始 “膨胀 ”了 了 …… 

或 者 并 非 如 此 。 令 报告 厅 中 的 一 些 人 意外 的 是 ， 阿 瓦 迭 指出 内 生 分 层 得 出 的 
结论 并 没有 根据 。 分 层 的 自动 化 创造 了 它 本 身 的 回归 平均 ! 内 生 分 层 的 结论 并 非 
来 自 数据 ， 而 是 内 生 分 层 本 身 产 生 的 假象 ! 

难以 置信 ! 都 2015 年 了 ， 地 球 上 最 优秀 的 统计 学 家 仍然 发 现 一 些 相 对 简单 的 统 
计 模 型 在 根本 上 就 是 错误 的 ， 而 某 些 一 流 统计 学 家 却 仍然 在 随意 使 用 这 些 模 型 ! 

几 个 星期 之 后 ， 我 请 了 几 天 年 假 ， 去 探望 一 位 在 美国 硅谷 的 朋友 。 这 位 朋友 
在 某 个 互联 网 巨头 那里 工作 。 我 跟 他 分 享 了 自己 现在 深 深沉 迷 于 统计 学 中 那些 布 
满 陷 阱 的 微妙 难点 。 几 个 月 之 前 ， 美 国 斯 坦 福 大 学 的 拉 梅 什 : 乔 哈里 教授 就 已 经 
把 我 镇 住 了 。 当 时 他 在 研讨 会 上 证 明了 ， 只 要 我 们 收集 足够 多 的 数据 ， 用 以 得 出 
结论 , p 值 方法 最 终 必定 会 否定 任何 假设 一 一 我 们 在 第 5 章 就 讲 过 这 个 问题 了 ! 

比 起 乔 哈 里 对 p 值 的 批评 ,我 的 朋友 对 阿 瓦 迭 对 内 生 分 层 的 批评 更 有 兴 
他 让 我 再 向 他 解释 一 次 ， 然 后 又 让 我 解释 了 第 二 次 、 第 三 次 。 然 后 他 突然 向 我 惊 
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呼 :“ 但 是 我 觉得 我 们 之 前 测试 新 产品 的 时 候 就 是 这 么 做 的 1” 

实际 情况 是 ， 为 了 进行 测试 ， 我 这 位 朋友 测量 了 用 户 的 点 击 数 ， 然 后 将 它 与 
旧 产 品 的 点 击 数 进 行 了 对 比 。 他 并 没有 测量 到 在 统计 学 上 显著 的 差异 一 一 乔 哈里 
会 说 他 等 待 数据 的 时 间 还 不 够 长 ! 但 是 内 生 分 层 让 他 能 够 得 出 结论 。 

根据 他 的 分 析 ， 对 于 点 击 率 一 开始 较 低 的 用 户 来 说 ， 新 产品 比 旧 产 品 表现 得 
更 好 ; 但 对 于 点 击 率 一 开始 较 高 的 用 户 来 说 ， 情 况 就 反 过 来 了 。 我 的 朋友 甚至 找 
到 了 事后 的 解释 ， 主 要 根据 的 是 不 同 用 户 的 地 理 位 置 。 这 个 解释 佐证 了 结论 ， 但 
这 个 来 自 内 生 分 层 的 结论 在 根本 上 就 错 了 。 

儿 天 之 后 ,我 给 这 位 朋友 发 了 阿 瓦 迭 发 表 的 文章 ， 他 回复 我 说 :“ 我 分 析 了 其 
中 一 项 实验 ， 看 到 其 中 用 到 了 一 个 内 生变 量 (…… ) 来 将 结果 分 类 。 实 验 本 身 还 
行 , 但 是 之 后 对 群体 的 分 析 方 法 是 错误 的 (…… )。 解决 办 法 就 是 利用 一 个 不 改变 
分 组 方式 的 外 部 变量 。 谢 谢 你 让 我 想到 这 一 点 ! 我 已 经 向 其 他 人 分 享 了 这 个 分 析 ， 
之 后 的 实验 就 会 (得 到 ) 正确 ( 的 分 析 ) Feet 

一 个 像 我 这 样 销 研 理论 的 人 ， 看 到 理论 在 实践 中 产生 如 此 直接 的 影响 ， 这 是 
何等 荣幸 ! 但 可 惜 我 从 来 没有 收 到 他 的 公司 的 酬金 …… 


































































































进行 随机 化 吧 ! 





辛普森 悖 论证 明了 ， 对 数据 的 正确 分 析 必 须 研 究 这 些 数据 以 外 的 混杂 因素 。 
但 如 果 我 们 只 有 数据 的 话 ， 怎 么 样 才 能 找到 这 些 混杂 因素 ?我 们 应 该 如 何 对 抗 辛 
ERWE? 

虽然 我 之 前 对 罗 纳 德 ， 费 希 尔 的 描述 相当 负面 ， 因 为 他 对 于 自己 立场 的 那 种 
教条 主义 和 针对 反面 意见 的 激烈 反 驶 都 确实 对 统计 学 的 发 展 有 着 相当 不 良 的 影响 ， 
但 我 们 还 是 要 重复 、 强 调 并 赞扬 他 说 过 的 这 人 句 话 :“ 要 进行 随机 化 。” 

的 确 ， 为 了 在 某 个 人 群 中 测试 某 个 产品 ， 我 们 必须 比较 暴露 于 某 个 变量 或 者 产 
品 的 人 群 以 及 未 受 影响 的 人 群 。 第 二 个 人 群 因此 也 被 称 为 控制 组 或 者 证 据 组 。 然 
而 ， 为 了 对 抗 所 有 混杂 因素 ， 我 们 不 应 该 将 对 人 和 群 的 划分 交 给 随机 性 。 但 其 实 我 
们 正 应 该 这 样 做 ! 我 们 应 该 将 这 个 任务 完全 交 给 随机 性 。 这 是 因为 对 人 和 群 的 划分 
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是 系统 性 地 进行 的 ， 也 就 是 由 科学 家 选择 的 系统 决定 的 ， 或 者 是 由 环境 因素 决定 的 ， 














因此 我 们 确定 其 中 会 存在 混杂 因素 。 即 使 这 些 混 杂 因 素 扮演 的 角色 可 以 忽略 不 计 ， 


我 们 也 必然 无 法 肯定 


种 测试 里 ， 医 生 会 给 


是 因为 存在 安慰 剂 效应 。 


慰 剂 的 时 候 更 好 。 




















iW 
实际 功效 O, 
在 更 一 





义 ， 也 就 是 那些 根据 伽利略 开启 的 传统 进 


情况 的 
在 费 希 尔 式 的 传统 做 法 中 ， 
全 每 位 患者 开 出 新 药 或 者 安慰 
者 还 是 医生 都 不 知道 处 方 中 的 药物 是 新 药 还 是 安 


这 会 对 患者 的 健康 产生 正本 


看 ， 医 生 也 必须 绝对 不 知道 他 开 出 的 处 方 是 


为 ， 实 验证 明了 那些 自愿 开 出 安慰 剂 药方 的 医生 在 动作 上 缺乏 信心 与 热情 
效应 如 此 明显 ， 会 导致 患者 身上 的 安奈 剂 效应 下 降 。 随 机 双 育 测试 人 




















如 此 ， 因 此 我 们 必然 无 法 全 盘 相信 











测试 新 药物 的 药学 标准 就 是 随机 双 
剂 的 处 方 。 
aF 





重点 在 于 ， 








如 果 患 者 相信 自 








i 的 生理 效应 。 














实验 的 结果 。 


itl 


这 一 点 非常 关键 。 
己 的 确 服用 了 药物 ， 但 实际 服用 的 却 
患者 的 健康 会 比 知 道 














试 。 在 这 
无 论 是 患 
~É 
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学 实验 可 以 进行 次 数 庞大 上 
这 两 类 实验 的 唯 








Er 
变量 。' 











的 前 提 下 “”， 我 们 就 能 确 确 实 


实地 研究 这 个 


变量 了 。 











© 从 技术 上 来 说 ， 随 机 化 实 
见 相反 的 是 ，4 在 这 里 的 确 


男 一 些 值 来 说 却 会 造成 灾难 
我 们 考虑 的 Z 的 分 布 。 
我 们 注意 到 一 个 有 1】 
自由 落体 不 仅 可 能 依赖 于 物 
的 话 ， 那 么 对 于 特定 旧 
向 。“ 在 所 有 其 他 情况 
与 知识 的 所 有 其 他 侧 音 





















































P[841=EP[814, Z]14] 与 P[B| 非 4]= 


然而 人 
HAUSSE, 


E 的 物体 ， 
相同 的 前 
一 样 ， 





际 上 就 是 比较 Ez(PLB|A, Z]] 与 Ez[P[3| 非 4, 2]]， 
Ez[P[B| dE 4, Z]| dE 4]。 与 我 们 在 第 














白药 还 是 安慰 剂 ， 





这 是 因 


， 这 个 


让 我 们 控制 
的 混杂 因素 ， 从 而 令 实验 结果 确实 对 应 我 们 希望 研究 的 现象 ， 也 就 是 新 药 的 


般 的 情况 下 ， 这 种 对 混杂 因素 的 控制 正 是 优秀 传统 科学 实验 的 存在 意 
井 行 的 科学 实验 。 在 理想 情况 下 ， 
4 重复 ， 每 次 重复 都 执行 两 类 几乎 完全 相同 的 实验 ， 而 
区 别 就 在 于 我 们 希望 确定 其 效应 的 


这 些 科 


在 所 有 其 他 情况 相同 


而 不 是 比较 


B5 章 提出 的 批评 意 

















对 药物 的 事实 ， 而 不 是 在 过 去 服 





应 着 服用 

















性 的 后 果 。 更 粳 
门 鲜 少 强调 这 个 分 布 造成 的 偏差 
就 是 这 个 概念 假设 我 们 已 经 确定 了 所 有 可 能 变化 的 


H, 


用 过 这 种 药物 的 事 
尽管 如 此 ， 得 出 的 结论 仍然 可 能 是 4 没有 效果 ,但 对 于 Z 的 某 些 值 来 说 它 可 以 救命 ， 而 对 于 
WERE, HUGE Ez[P[B|4, 21] 的 数值 都 依赖 于 
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Kl 





素 。 例 如 ， 











体 的 高 度 ， 还 可 能 依赖 于 它 的 势能 。 如 果 我 人 
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我 们 不 可 能 在 维持 势能 恒定 的 情况 下 ， 




















] 相 信和 经 
只 测试 高 度 对 落体 


[物理 正确 


的 影 














提 下 ” 这 个 概念 似 平实 际 上 就 先 假定 使 


这 一 概念 在 根本 上 就 是 主观 的 。 











用 了 某 个 模型 ， 


AE 
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然而 ， 这 样 的 科学 实验 只 能 代表 我 们 日 常 所 做 的 科学 实验 中 极其 微小 的 一 部 分 。 
即使 是 科学 家 也 满足 于 仅仅 在 不 同 的 时 间 和 地 点 用 不 同 的 材料 重复 进行 实验 。 更 糟糕 
的 是 ,大 数据 的 降临 开启 了 无 孔 不 入 的 数据 采集 ， 罗 纳 德 ， 费 希 尔 所 主张 的 随机 化 也 
被 纳入 其 中 。 但 如 果 说 辛普森 悖 论 让 我 们 懂得 要 强调 什么 东西 的 话 ， 那 就 是 原始 数据 
并 没有 告诉 我 们 一 切 。 采 集 这 些 数据 的 情景 对 于 数据 分 析 来 说 至 关 重 要 。 那 些 外 国人 
的 年 龄 、 性 别 和 社会 经 济 地 位 是 怎么 样 的 ?那些 白人 罪犯 的 受害 者 又 是 谁 ? 去 私人 诊 
所 的 是 哪些 患者 ? 接受 实验 的 患者 知 不 知道 那 是 安奈 剂 ? 为 什么 那个 飞行 员 被 批评 了 ? 

因此 ， 不 通过 费 希 尔 式 的 随机 化 而 采集 到 的 统计 数据 中 遍布 着 有 关 数 据 情景 
的 陷阱 。 没 有 语 境 和 质疑 ， 概 率 检验 就 会 出 问题 。 我 们 绝对 不 能 盲目 相信 这 些 关 
据 ， 必 须 以 最 大 的 庶 慎 来 进行 解释 ， 同 时 绝对 要 有 怀疑 精神 。 对 于 纯粹 贝 叶 斯 3 
义 者 来 说 ,我 们 绝对 要 在 洞悉 ( 多 个 ) 先 验 可 信和 模型 的 情况 之 下 解释 这 些 数 据 ， 因 
为 这 些 模型 会 指出 统计 分 析 所 需 的 合适 的 混杂 因素 。 即 使 这 样 ， 也 不 能 忘记 这 些 
模型 的 可 信和 度 是 有 限 的 。“ 所 有 模型 都 是 错 的 "， 特 别 是 ,“ 要 尽量 避免 得 出 结论 ”。 
然而 ， 这 种 对 统计 的 怀疑 当然 不 应 该 被 解释 成 对 其 他 方法 的 接受 。 恰 好 相反 ， 
如 果 连 统计 数据 都 可 以 在 任何 时 候 将 我 们 轻易 引 向 错误 ， 那 么 我 们 就 更 应 该 警惕 
那些 无 法 找到 依据 的 信念 了 ! 
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苏格兰 黑色 绵羊 的 回归 





我 们 现在 可 以 回 到 在 第 4 章 看 到 的 那个 故事 ， 也 就 是 生物 学 家 、 物 理学 家 和 
数学 家 到 苏格兰 旅行 ， 在 那里 发 现 了 一 只 黑色 的 绵羊 的 故事 。 你 可 能 还 记得 。 数 
学 家 对 物理 学 家 的 过 度 推广 不 以 为 然 ， 因 为 物理 学 家 认为 绵羊 的 另 一 侧 ， 也 就 是 
他 们 看 不 到 的 那 一 侧 ， 也 应 该 是 黑色 的 。 

但 是 物理 学 家 的 解释 似乎 也 不 是 十 分 离奇 。 毕 况 某 只 动物 一 侧 的 颜色 与 男 一 
侧 的 颜色 有 着 非常 清晰 的 相关 性 。 恰 好 一 半 白 色 、 一 半 黑 色 的 猫 毕 竞 非 常 罕见 ， 
而 看 到 这 只 猫 的 角度 恰好 使 得 看 到 的 部 分 正好 只 有 一 种 颜色 的 概率 就 更 低 了 。 物 
理学 家 的 推广 似乎 并 非 训 无 道理 。 

然而 动物 某 一 侧 的 颜色 似乎 并 不 能 决定 男 一 侧 的 颜色 ， 反 过 来 也 不 成 立 。 怎 
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么 解释 动物 一 侧 的 颜色 几乎 总 是 与 另 一 侧 相同 呢 ? 在 这 里 同样 有 一 个 共同 原因 ， 
就 是 考虑 的 那 只 动物 的 基因 。 实 际 上 ， 如 果 我 们 回溯 时 间 的 话 ， 那 就 会 发 现 一 只 
动物 原本 来 自 单个 细胞 ， 它 包含 着 被 称 为 脱氧 核糖 核酸 ( 以 下 简称 DNA ) 的 分 
子 。 然 后 ， 这 个 细胞 会 自我 复制 ， 而 其 中 的 DNA 分 子 会 复制 成 完全 相同 的 另 一 
份 。 正 因 如 此 ， 同 一 只 动物 的 所 有 细胞 中 都 包含 着 相同 的 DNA， 而 它 通过 基因 的 
表达 决定 了 动物 两 侧 的 颜色 。 

但 有 趣 的 是 ， 这 个 解释 其 实 非常 现代 ， 毕 竟 DNA 的 结构 在 1953 年 才 被 发 现 。 
数 千年 间 ， 人 们 无 法 得 知 上 面 说 到 的 那个 共同 原因 的 解释 。 然 而 ， 我 们 很 难 想象 
有 人 会 觉得 动物 两 侧 颜 色 之 间 的 相关 性 可 以 用 因果 关系 来 解释 。 那 么 人 们 是 怎么 
解释 这 种 相关 性 的 呢 ? 如 果 不 提 到 DNA 分 子 的 话 ， 怎 么 解释 动物 通常 全 身 都 是 一 
个 颜色 ? 















































猫 是 什么 ? 


2012 年 ， 谷 歌 因 一 条 奇怪 而 又 令 人 不 安 的 公告 登 上 了 各 大 新 闻 头 条 。 据 这 些 
头条 所 说 ， 谷 歌 的 人 工 智能 发 现 了 “ 猫 ” 这 个 概念 巴 ! 很 多 人 可 能 觉得 这 是 个 平 
平 无 奇 的 新 闻 ， 但 对 我 来 说 ， 这 是 机 器 学 习 的 一 个 里 程 碑 式 的 惊人 突破 ， 可 能 比 
AlphaGo 在 四 年 之 后 大 败 李 地 石 给 人 留 下 的 印象 更 深刻 、 更 出 人 意料 。 
要 理解 这 一 点 ， 首 先 要 说 明 谷歌 的 人 工 智能 是 一 个 人 工 神经 网 络 ， 带 有 一 些 接收 
器 ,证 它 可 以 “看 见 ” 数 字 化 图 像 。 谷 歌 给 这 个 人 工 神 经 网 络 展示 了 1000 万 幅 图 像 ， 
其 中 不 包含 上 下 文 。 然 后 ， 谷 歌 将 这 个 人 工 神 经 网 络 放 进 某 种 相当 于 核磁 共振 成 像 的 
处 理 系统 中 ,用 以 测量 它 暴 露 在 其 他 图 像 中 的 时 候 神经 元 的 实时 激活 状态 。 谷 歌 意识 
到 其 中 某 些 神经 元 大 体 上 当 目 仅 当 向 其 展示 的 图 像 包含 一 只 猫 时 才 会 激活 ! 

真正 给 人 留 下 深刻 印象 的 是 ， 这 并 不 是 谷歌 在 设计 这 个 人 工 智能 的 时 候 设 定 
的 目标 。 这 个 人 工 智能 的 目标 是 以 最 合理 有 效 的 方式 分 析 、 处 理 并 解释 图 像 中 的 
内 容 。 人 工 智能 必须 为 它 看 到 的 那些 图 像 建立 一 个 模型 。 为 此 ， 它 必须 做 的 事情 
之 一 就 是 解释 图 像 中 某 些 像素 颜色 之 间 反 复出 现 的 相关 性 。 比 如 说 ， 当 图 像 中 的 
某 些 像 素 构成 了 眼睛 的 形状 ， 那 么 在 它 的 左边 或 者 右边 不 远 处 通常 会 有 一 份 与 这 
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些 像素 相似 的 复制 品 。 一 只 眼睛 的 图 像 通常 伴随 着 男 一 只 眼睛 的 图 像 。 怎 么 解释 
眼睛 很 少 单独 出 现 这 一 点 呢 ? 

最 惊人 的 其 实 是， 这 个 问题 的 解释 似乎 大 体 符合 我 们 之 中 大 多 数 人 会 给 出 的 
答案 : 因为 照片 拍 到 的 动物 通常 有 两 只 眼睛 。 人 、 狗 和 猫 (几乎 ) 都 拥有 两 只 眼 
晴 这 个 事实 对 我 们 来 说 似乎 如 此 微不足道 ， 人 们 几乎 不 会 对 它 花 上 任何 时 间 进 4 





























本 进行 
思考 。 我 们 是 如 此 习惯 于 日 常生 活 中 的 事物 ， 以 至 于 我 们 甚至 不 再 寻求 解释 一 一 
但 这 其 实 是 个 迷人 的 生物 学 问题 ， 需 要 对 视差 的 数学 理解 ! 

但 对 我 来 说 更 迷人 的 是 ， 我 们 竟然 可 以 (大体 上 ) 对 于 什么 是 人 、 什 么 是 猫 、 










































































怎么 定义 猫 这 个 概念 ?更 重要 的 是 ， 猎 存在 吗 ? 

要 理解 “ 猫 ” 这 个 概念 的 奇怪 之 处 ,我 们 可 以 先 强 调 这 个 定义 有 多 么 模糊 。 人 
们 一 般 认为 猫 就 是 两 只 猫 交 配 后 产生 的 东西 ， 换 句 话 说 ， 猫 的 双亲 都 是 猫 。 到 这 里 
为 止 还 没有 什么 惊人 的 东西 ， 甚 至 这 可 能 还 是 非常 显然 的 东西 。 但 其 中 大 有 深意 。 
比如 说 现在 有 一 只 猫 ， 它 的 双亲 都 是 猫 ， 它 的 双亲 的 双亲 也 是 猫 ， 它 的 双亲 
的 双亲 的 双亲 也 是 猫 ， 以 此 类 推 。 但 是 这 种 对 时 间 的 回溯 并 没有 尽头 ! 根据 这 种 
推理 ， 我 们 必须 回溯 生命 演化 树 ， 到 达 猫 还 没有 出 现 的 年 代 ! 的 确 ， 如 果 我 们 回 
漳 到 几 亿 年 甚至 几 十 亿 年 前 ， 我 们 会 到 达 一 个 没有 哺乳 动物 、 疹 椎 动物 ， 甚 至 连 
真 核 生物 都 不 存在 的 时 代 ! 猫 的 双亲 都 是 猫 ， 或 者 说 猫 就 是 两 只 猫 交 配 后 产生 的 
东西 ， 这 些 说 法 在 逻辑 上 就 有 矛盾 Un. 

我 预计 到 有 些 读 者 会 提出 用 DNA 的 概念 来 定义 猫 这 个 概念 。 然 而 这 会 导致 几 
个 问题 。 首 先 ， 我 们 还 没有 对 猫 的 所 有 基因 组 进行 测序 ， 而 我 们 可 能 永远 无 法 对 
所 有 猫 的 基因 组 进行 测序 ， 因 为 未 来 的 猫 现在 还 没有 出 生 ! 所 以 怎么 定义 一 组 与 
猫 对 应 的 DNA 代码 并 不 是 一 个 显然 的 问题 。 其 次 ， 即 使 我 们 成 功 做 到 了 这 一 点 ， 
还 要 对 动物 进行 基因 组 测序 才能 断定 它 是 不 是 猫 ， 这 个 解决 方案 在 现实 中 完全 不 
可 行 。 再 次 ， 人 们 也 许 会 严肃 地 考虑 ， 包 含 猫 的 全 套 DNA 的 一 个 单独 的 猫 细 胞 ， 
比如 猎 毛 中 的 细胞 ， 它 算 不 算 一 只 猫 ? 最 后 也 是 最 重要 的 一 点 就 是 ，DNA 这 个 概 
念 在 大 约 半 个 世纪 之 前 完全 不 存在 。 往 好 了 说 ， 这 意味 着 薛 定 廖 、 达 尔 文 和 亚 里 
士 多 德 在 谈论 猫 的 时 候 其 实 不 知道 自己 在 说 什么 。 
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我 们 必须 理解 这 个 显而易见 的 事实 :“ 猫 ”这 个 词 并 没有 一 个 令 人 满意 的 严谨 
的 定义 。 如 果 我 问 你 猫 是 什么 ， 你 无 法 给 出 一 个 普遍 适用 、 毫 无 争议 的 定义 。 而 
这 不 是 什么 惊人 的 事情 ， 上 毕竟 你 不 是 通过 这 种 方式 学 到 怎么 认 知 并 使 用 “ 猫 ” 这 
个 概念 的 ! 如 果 你 大 概 知道 猫 是 什么 ， 那 是 因为 你 已 经 看 过 上 千张 甚至 上 百 万 张 
猫 的 图 像 ， 你 也 听 说 过 猫 ， 也 读 过 有 关 猫 的 材料 。 你 通过 观察 大 量 数据 学 到 了 猎 
是 什么 。 但 你 从 来 没有 看 见 过 关于 “ 猫 是 什么 ”的 形式 定义 ! 实际 上 ， 在 人 类 历 
史 中 ， 没 有 人 知道 怎么 给 出 “ 猫 是 什么 ”的 形式 定义 。 

还 有 更 神奇 的 。 必 定 存在 第 一 个 想到 “ 猫 ” 这 个 概念 的 人 。 因 为 这 个 人 是 第 
一 个 想到 这 个 概念 的 ,不 会 有 人 教 他 这 一 点 ， 所 以 这 个 人 就 自己 发 明了 “ 狂 ” 这 
个 概念 。 为 什么 ? 他 又 是 怎么 做 到 的 ? 人 类 引入 的 新 概念 从 何 而 来 ?这 种 能 力 是 
人 类 智慧 特有 的 吗 ? 

我 觉得 谷歌 人 工 智 能 的 发 现 非常 震撼 人 心 ， 因 为 它 给 出 了 这 些 问题 的 答案 。 
不 ， 这 并 非 人 类 智慧 特有 的 能 力 ， 因 为 谷歌 的 神经 网 络 同样 做 到 了 这 一 点 。 而 它 
做 到 这 一 点 是 因为 它 希 望 分 析 、 综 合并 解释 数字 化 图 像 中 不 同 像素 颜色 之 间 的 相 
关 性 ， 它 希望 得 到 一 个 模型 来 描述 自己 看 到 的 东西 ， 而 它 找到 的 模型 自然 导致 了 
“ 猫 ” 这 个 概念 的 诞生 ! 




















































































































诗 性 自然 主义 


这 就 将 我 们 引 向 了 本 章 最 吸引 人 的 问题 。 猫 是 抽象 模型 中 的 概念 ， 但 如 此 一 
来 ， 猎 是 否 存 在 ?这 个 问题 听 起 来 很 傻 。 你 可 能 很 想 大 喊 一 声 :“ 那 当然 啊 ， 我 们 
天 天 都 能 看 到 它们 !” 但 如 果 我 们 考虑 在 今天 最 可 信 的 物理 理论 一 一 粒子 物理 学 的 
标准 模型 一 一 的 话 ， 那 么 整个 宇宙 不 过 是 由 量子 场 构成 的 ， 而 量子 场 的 激发 态 会 
被 量子 化 ， 形 成 电子 、 夸 元 、 光 子 以 及 其 他 物质 的 组 成 部 分 。 无 论 在 这 个 模型 中 ， 
还 是 在 物理 中 ， 我 们 都 无 法 找到 “ 猫 ” 这 个 概念 的 容 身 之 处 。 物 理 理论 甚至 否定 
量子 场 以 外 的 对 象 的 存在 。 因 此 ， 物 理 的 标准 模型 否认 猫 的 存在 。 我 们 最 多 只 能 
说 它 是 以 某 种 特定 方式 排列 而 成 的 一 堆 电 子 、 质 子 和 中 子 。 

PER HE + 卡 罗 尔 在 他 的 杰作 《大 图 景 》 一 书 中 就 提出 了 这 样 的 问题 ， 
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当 我 们 看 到 猫 在 追 老鼠 的 时 候 , “这 只 猫 想 把 老鼠 吃 了 ”这 种 说 法 在 科学 上 是 正确 
的 。 我 们 应 否 接 受 猫 、 老 鼠 以 及 猫 可 能 拥有 的 意向 的 存在 呢 ? 

对 于 肖 恩 ' 卡 罗 尔 来 说 ， 即 使 理论 物理 学 否定 了 这 些 概念 的 现实 性 ， 谈 论 猫 、 

老鼠 和 意向 仍然 是 讨论 我 们 刚才 给 出 的 情况 的 正确 方式 。 这 是 因为 ， 这 样 做 的 话 ， 
我 们 实际 上 考虑 的 是 现实 中 的 另 一 个 模型 ， 它 当然 与 理论 物理 学 中 的 概念 存在 冲 
突 ， 但 在 进行 预测 方面 并 不 会 变 得 格格 不 入 。 特 别 是 所 谓 的 涌现 现象 ， 它 能 够 作 
为 对 现实 的 不 同 描述 的 沟通 桥梁 ， 其 中 一 些 描述 更 精细 ， 但 过 于 复杂 ， 而 另 一 些 
更 粗糙 ， 但 更 有 用 。 这 种 现象 即使 在 物理 学 中 也 广为人知 ， 诸 如 温度 和 气压 等 概 
念 就 是 从 宏观 视点 涌现 而 来 的 一 一 即使 粒子 物理 学 否认 这 些 概 念 的 存在 。 
HE + 卡 罗 尔 以 此 支持 被 他 称 为 诗 性 自然 主义 ( poetic naturalism ) 的 认识 论 
新 立场 。 他 认为 所 有 关于 现实 的 理论 都 是 某 种 诗歌 ， 引 入 了 自身 特有 的 概念 ， 自 
身 能 做 出 预测 。 据 卡 罗 尔 所 言 ， 这 些 有 用 的 概念 也 指向 某 种 形式 的 现实 。 这 种 
想法 也 类 似 于 斯 带 分 . 霍金 和 列 纳 德 . 蒙 洛 迪 诺 提出 的 “依赖 模型 的 实在 主义 ” 
( mode-dependent realism )， 根 据 这 个 概念 ， 所 有 理论 都 定义 了 它 自身 的 现实 。 所 
以 根据 粒子 物理 学 ， 猫 并 不 是 真实 的 ; 但 在 我 们 更 熟悉 的 现实 模型 之 中 ， 猫 的 确 
存在 ， 而 这 个 模型 也 会 说 追 着 老鼠 跑 的 猫 很 有 可 能 想 吃 掉 老 鼠 。 

卡 罗 尔 、 霍 金 和 蒙 洛 迪 诺 的 立场 似乎 至 少 部 分 符合 贝 叶 斯 主义 。 纯 粹 贝 叶 斯 主 

义 者 会 强烈 否定 模型 以 外 任何 东西 的 存在 。 对 于 所 罗 门 诺 夫 妖 而 言 ， 只 有 传感器 测量 
到 的 实验 数据 ， 知 识 可 以 归结 为 在 给 定 这 些 数 据 的 前 提 下 确定 最 可 信 的 模型 。 无 论 如 
何 ， 这 就 是 谷歌 的 人 工 智能 的 运作 方式 。 因 此 ， 猫 之 类 的 抽象 概念 只 是 理解 相关 性 所 
用 到 的 可 信和 模型 的 一 部 分 ， 或 者 说 是 在 进行 预测 时 所 需 的 计算 里 的 中 间 步 又 。 
此 外 ， 这 些 抽象 概念 也 恰好 是 混杂 因素 〈 或 者 说 简明 因素 )， 它 们 允许 我 们 不 
通过 因果 联系 来 解释 不 同 的 相关 性 ， 而 我 们 之 后 会 看 到 这 些 概 念 在 大 量 机 带 学 习 
模型 中 扮演 着 关键 的 角色 。 正 是 这 些 抽象 概念 解释 了 为 什么 公立 医院 比 私 人 诊所 
好 ， 以 及 为 什么 认为 一 侧 为 黑色 的 绵羊 男 一 侧 也 是 黑色 的 置信 度 很 高 是 合理 的 。 

最 后 ， 这 些 概 念 的 存在 性 或 者 现实 性 并 不 重要 ,“ 所 有 模型 都 是 错 的 "。 重 要 
的 是 ， 在 帮助 纯粹 贝 叶 斯 主义 者 解释 接收 到 的 数据 时 ， 以 及 帮助 她 进行 预测 时 ， 
这 些 概念 都 很 有 用 。 
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正确 问题 的 近似 解答 的 价值 远 远 大 于 错误 问 
题 的 精确 解答 的 价值 。 
2538 + 图 基 (1915—2000 ) 
À (Ce ) 实在 过 于 复杂 ， 除 了 近似 以 外 
都 不 可 行 。 
约翰 冯 ，… 诺 伊 曼 (1903—1957 ) 
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素数 的 奥秘 


2016 年 3 月 11 日 ,罗伯特 ' HUE + 奥利弗 与 卡 纳 安 : 孙 达 拉 拉 詹 在 实验 中 
发 现 了 素数 的 最 后 一 位 数字 并 不 是 随机 的 。 这 些 数字 倾向 于 避免 重复 。 最 后 一 位 
数字 是 3 的 素数 ( 比如 23 和 43) 之 后 的 下 一 个 素数 ， 其 最 后 一 位 数字 更 常 是 7 而 
不 是 3。 对 于 数学 界 来 说 ， 这 是 个 令 人 无 比 惊讶 的 消息 ; 但 对 于 其 他 人 来 说 ， 最 惊 
人 的 事 可 能 是 这 个 发 现 会 令 人 吃惊 …… 

素数 就 是 那些 因数 只 有 1 和 自己 的 数 。 头 几 个 素数 是 2、3、5、7、11、13、 
17， 等 等 。 对 它们 的 研究 迷 住 了 数 千 年 以 来 一 代 又 一 代 的 数学 家 。 超 过 2000 年 
前 ， 欧 几 里 得 就 证 明了 存在 无 穷 个 素数 。2002 年 ， 阿 格拉 沃 尔 、 卡 亚 勒 和 萨 克 赛 
纳 找到 了 能 判定 某 个 数 是 不 是 素数 的 多 项 式 时 间 算 法 。2012 年 ， 张 益 唐 证 明了 存 
在 无 穷 对 相 邻 的 素数 ， 它 们 之 间 的 差 小 于 7000 万 。 人 们 已 经 发 现 了 关于 整数 乘法 
结构 的 这 些 基本 砖 块 的 许多 结论 。 
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然而 ， 大 量 基础 问题 仍然 悬而未决 。 哥 德 巴赫 猜想 断言 ， 所 有 大 于 2 的 偶数 
都 能 表达 为 两 个 素数 之 和 。 挛 生 素 数 猜想 断言 ， 存 在 无 穷 组 相差 2 的 素数 ， 比 如 
3 和 5、41 和 43、137 和 139。 黎 曼 猜 想 则 上 断言， 可 以 通过 某 个 神秘 函数 一 一 黎 曼 5 
(也 写作 “zeta”) 函数 的 一 些 数学 性 质 来 推 知 素数 的 分 布 。 我 们 之 后 会 再 讨论 这 些 
问题 。 

最 难 的 未 解 问题 之 一 就 是 寻找 能 计算 第 二 个 素数 的 快速 算法 。 另 一 个 几乎 等 
价 的 问题 就 是 利用 快速 算法 来 确定 小 于 的 素数 个 数 。 任 何 解 决 这 些 问题 的 人 都 
会 载 誉 而 归 ! 然而 ， 这 并 不 是 说 这 些 问 题 终 有 一 天 会 被 解决 。 直 到 今天 ， 据 我 所 
知 ， 最 好 的 算法 就 是 德 莱 格 利 斯 和 里 瓦 在 1996 年 发 表 的 算法 ， 但 这 个 算法 的 计算 
时 间 仍 然 是 n 的 位 数 的 指数 函数 。 

这 就 带 来 了 预测 问题 的 另 一 个 难点 。 素 数 的 这 个 情况 ， 既 不 是 本 质 上 随机 的 ， 
又 并 非 在 认识 论 上 不 确定 的 ， 甚 至 也 不 是 混沌 的 。 如 果 素 数 都 在 本 质 上 无 法 预测 
的 话 , 那 就 是 因为 ,预测 第 古 戈 尔 "个 素数 所 需 的 计算 量 对 我 们 的 大 脑 和 计算 机 来 
说 肯定 过 于 庞大 了 ! 

拉 姆 齐 定理 同样 提出 了 一 些 问 题 ， 我 们 知道 解决 方法 ， 但 这 些 方法 全 都 需要 
不 可 思议 的 计算 量 。 比 如 说 考虑 下 面 这 个 问题 : 确定 顶点 数 最 小 的 完全 图 ， 使 得 
如 果 将 边 染 成 红色 或 者 蓝 色 的 话 ， 无 论 染 色 方法 如 何 ， 都 可 以 保证 至 少 有 一 个 拥 
有 nn 个 顶点 的 子 图 ， 其 中 所 有 边 都 是 同色 的 。 如 果 你 不 明白 这 里 说 的 是 什么 ， 没 
有 关系 ， 细 节 并 不 重要 。 

如 果 z=3， 那 么 我 们 一 直 以 来 都 知道 答案 是 6， 证 明 很 简单 。 如 果 n-4, R 
们 知道 答案 是 14， 但 证 明 “ 就 没 那么 简单 了 ”， 这 是 数学 家 埃 尔 德 什 : 帕 尔 的 说 
法 。 那 么 n=5 是 什么 情况 呢 ?“ 没 有 人 知道 ， 答 案 是 41 和 55 之 间 的 某 个 数字 ?。” 

“假设 现在 外 星 的 邪 恶 生命 对 人 类 说 :“ 告 诉 我 (=) 5 的 答案 ， 否 则 我 就 毁 
KAŽ 我 会 开玩笑 说 ， 在 这 种 情况 下 最 好 的 做 法 就 是 利用 数学 和 计算 机 算出 这 
个 答案 ,” 埃 尔 德 什 这 样 说 ,“ 如 果 它 们 要 求 的 是 (n= ) 6 的 答案 的 话 Conn )， 那 
么 最 好 的 做 法 就 是 在 它们 摧毁 我 们 之 前 摧毁 它们 ， 因 为 我 们 不 可 能 解决 (n= ) 6 



































































































































Q 1 ERREF 10, 
© 截至 本 书 出 版 之 时 ， 我 们 只 知道 答案 在 43 和 48 之 间 。 
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的 情况 。” 某 些 问 题 不 可 能 解决 ， 不 是 因为 我 们 不 知道 怎么 去 解决 它们 ， 而 是 因为 
解决 这 些 问 题 所 需 的 计算 能 力 远 远 超出 了 物理 允许 的 范畴 。 


素数 定理 


在 无 法 绕 过 必要 的 计算 的 情况 下 ， 数 论 人 研究 者 自然 会 转向 近似 计算 。 第 一 个 
这 样 做 的 人 是 卡尔 - 弗 里 德里 希 高 斯 。 在 1800 年 前 后 ， 高 斯 开始 对 相 邻 素数 的 
间隔 感 兴趣 。3 和 5 的 间隔 是 2， 而 7 和 11 的 间隔 是 4。 高 斯 计算 出 ， 平 均 来 说 ， 小 
于 100 的 相 邻 素数 平均 间隔 是 4， 而 小 于 1000 的 相 邻 素数 平均 间隔 是 6， 小 于 10 000 
的 相 邻 素数 平均 间隔 是 8.1， 小 于 100 000 的 相 邻 素数 的 平均 间隔 是 104。 也 就 是 说 ， 
如 果 我 们 考虑 的 素数 大 小 变 成 之 前 的 10 倍 的 话 ， 相 邻 素数 之 间 的 平均 间隔 就 要 加 
上 2 多 一 点 (更 准确 的 数值 是 2.3 )。 

这 有 没有 让 你 想起 什么 ? 在 这 里 ， 乘 法 ( 乘 以 10) 被 转换 成 了 加 法 (加 上 大 
约 2.3 )。 相 邻 素数 平均 间隔 似乎 是 这 些 素数 的 对 数 函 数 。 高 斯 是 通过 下 面 这 个 直 
觉 领会 到 这 个 结论 的 : 小 于 等 于 的 素数 个 数 ， 记 作 x(n)， 似 乎 可 以 用 n/n(n) 来 近 
似 , 其 中 In(n) 是 所 谓 的 自然 对 数 "。 自 然 对 数 就 是 底 为 欧 拉 常 数 e= 2.718 的 对 数 。 

高 斯 做 出 了 明确 的 猜想 ， 就 是 用 n/ln(n) 来 近似 x(n) 的 话 ， 当 n 趋向 于 无 穷 大 
时 ， 相 对 误差 会 趋向 于 0 ! 我 们 也 说 ， 当 n 趋向 于 无 穷 大 时 ，x(n) 等 价 于 n/ln(n)。 
这 个 猜想 在 1896 年 变 成 了 素数 定理 ， 因 为 两 位 数学 家 雅克 … 阿达 马 和 夏 尔 - 
让 德 拉 瓦 莱 普 又 成功 独立 证 明了 这 个 对 素数 精确 分 布 的 近似 描述 。 即 使 这 只 是 
一 个 近似 ， 不 能 告诉 我 们 素数 的 准确 位 置 ， 但 这 个 出 色 的 定理 已 经 成 为 数论 的 标 
志 性 结论 之 一 ! 

1854 年 ， 高 斯 的 学 生 ， 也 就 是 那 位 才智 过 人 的 波恩 哈 德 ， 黎 曼 ， 在 n(n) 的 近似 
上 走出 了 更 远 的 一 步 。 借 助 另 一 个 同样 神秘 的 《函数 ， 黎 曼 成 功 得 到 了 n(n) 的 一 
个 准确 公式 。 特 别 是 ， 通 过 某 些 被 称 为 “函数 零点 的 数 可 以 计算 出 x(n) 的 精确 值 。 

当然 ， 这 里 有 陷阱 ， 还 是 两 个 陷阱 。 第 一 个 陷阱 就 是 我 们 并 不 确切 知道 这 些 



























































































































































© 我 们 能 看 到 In(10) ~ 2.3， 符 合 高 斯 的 观察 结果 。 
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零点 在 什么 地 方 〈 而 著名 的 黎 曼 假设 趾 正 是 指出 了 所 谓 的 非 平 几 零 点 实际 上 都 处 
于 复 平面 的 一 条 竖 直 直线 上 )。 另 一 个 陷阱 就 是 这 些 零点 有 无 限 个 ， 也 就 是 说 ， 黎 
曼 提 出 的 精确 计算 方法 需要 无 限 的 计算 量 。 








T 的 近似 


话 虽 如 此 ， 无 穷 计算 在 数学 里 遍地 都 是 。 这 些 计算 中 最 著名 的 可 能 是 周 角 率 
t( 它 与 历史 上 “ 喧 宾 夺 主 ”的 圆周 率 x 的 关系 是 n=7/2 )。 在 14 世纪， 伟大 的 印 
度 智者 摩 陀 婆 就 发 现 了 一 个 惊人 的 等 式 r=8 一 8/3+8/5 一 8/7+…; 也 就 是 说 ， 周 角 率 
t 不 过 就 是 奇数 倒数 的 交错 和 的 8 倍 ! 

我 们 可 能 会 认为 这 种 无 穷 计算 毫 无 用 处 。 但 事实 上 上， 无 穷 计算 在 应 用 数学 的 
简单 模型 中 无 处 不 在 ,流体 力学 方程 (导数 和 积分 都 是 无 穷 步 的 计算 结果 ) 就 是 
一 个 例子 。 这 是 因为 ， 即 使 无 穷 计 算 只 代表 了 一 种 不 可 计算 的 理想 情况 ， 但 它 一 
般 能 指出 进行 近似 计算 的 巧妙 方法 。 比 如 摩 陀 婆 的 等 式 就 能 用 于 计算 c 的 近似 值 ， 
也 就 是 说 ， 它 可 以 用 于 计算 半径 已 知 的 圆 的 周 长 。 工 程 师 在 实践 中 使 用 的 正 是 这 
类 近似 方法 。 

如 果 你 在 常用 的 计算 器 或 者 谷歌 上 查询 t 的 值 ， 它 们 很 有 可 能 会 撒 一 点 小 度 ， 
只 给 你 提供 小 数 点 后 十 几 位 数字 的 近似 值 。 这 个 问题 并 非 只 在 z 上 发 生 。 你 的 计 
算 器 对 于 那些 二 进 制 表示 并 非 有 限 的 数 都 处 理 得 非常 糟糕 让， 这 样 的 数 包 括 无 理 
常数 ， 例 如 e 和 V2 ， 还 有 某 些 有 理 数 ， 比 如 1/3 和 0.2。 此 外 ， 因 为 计算 器 只 能 处 
理 近 似 值 ， 所 以 它 可 能 会 得 出 一 些 违反 常理 的 结果 ， 比 如 说 (1/3)x3 2 1， 或 者 在 
x IG y 大 得 多 的 时 候 会 得 到 Qc-y)-x =0， 即 使 y 本身 大 于 0。 

数学 家 经 常会 认为 ， 在 计算 机 上 进行 的 计算 只 不 过 是 数学 理论 的 近似 。 所 罗 
门 诺 夫 妖 的 立场 却 完全 相反 。 对 于 所 罗 门 诺 夫 妖 来 说 ， 实 数 之 类 的 对 象 只 不 过 是 
一 些 让 我 们 可 以 构建 算法 并 对 其 更 好 地 进行 思考 的 模型 。 特 别 是 对 于 尝试 追随 所 
罗 门 诺 夫 妖 步伐 的 计算 机 科学 家 来 说 ， 他 们 用 于 尝试 衡量 置信 度 的 模型 并 不 是 由 
实数 作为 参数 组 成 的 模型 ， 而 是 那些 储存 在 计算 机 文件 中 的 模型 ， 其 中 用 到 的 只 
是 数学 模型 中 实数 的 截断 。 正 因 如 此 ， 与 数学 的 理想 状态 相反 ， 人 工 神 经 网 络 的 
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大 小 可 以 用 字 节 来 计数 "。 


学 或 者 数学 中 出 现 的 曲线 、 











如 果 说 对 7 这 样 的 数值 进行 高 精度 计算 毕 竞 获 益 有 限 ， 那 么 对 物理 学 、 生 物 
PR 








数 和 行为 进行 近似 就 会 产生 大 


定理 对 素数 计数 函数 进行 近似 就 是 这 样 的 情况 。 


更 一 般 的 框架 中 存在 这 样 一 项 ] 
身 简单 得 多 的 近似 版 本 。 这 项 工具 就 是 渐 近 展开 。 一 般 来 说 ， 





们 用 











条 直线 来 逼近 圆 上 的 一 小 段 圆 跌 ， 或 者 用 平面 来 通 近 






































的 一 小 块 表面 。 用 代数 术语 来 说 ， 这 相当 于 用 形 如 y=ax+b 
谓 的 非 线性 方程 。 对 于 那些 变化 足够 小 的 现象 来 说 ， 这 种 近似 完全 是 可 以 接受 的 。 
这 束 解 释 了 为 什么 我 们 要 在 学 校 里 花 上 这 么 长 的 时 间 来 研究 这 些 简 单 的 方程 ， 以 
及 为 什么 这 些 方程 在 科学 中 无 处 不 在 。 











义 相 对 论 方程 。 它 的 渐 近 展开 可 以 导出 牛顿 力学 ! 换个 说 法 
律 ， 特 别 是 关于 万 有 引力 的 定律 ， 只 不 过 是 爱 因 斯 坦 方程 的 
里 完全 适用 。 这 种 有 限 的 场景 就 是 所 谓 的 “ 弱 引 力 ”情况 %。 € 


我 们 能 



































到 ， 有 些 科学 的 捍卫 者 还 坚持 断定 牛顿 定律 在 适用 范围 内 是 “正确 ” 





量 的 应 用 。 通 过 素数 








[ 具 ， 它 对 于 任意 模型 都 可 以 计算 出 比 模型 本 


渐 近 展开 可 以 让 我 
(相当 圆润 的 ) HER 
的 仿 射 方程 来 通 近 所 

















对 物理 学 家 来 说 不 可 或 缺 的 渐 近 展开 ， 最 精彩 的 例子 可 能 就 是 爱 因 斯 坦 的 ) 

















， 就 是 牛顿 的 力学 定 
近似 ， 在 有 限 的 场景 


























的 。 纯 粹 贝 叶 斯 主义 者 可 不 这 样 认 为 。“ 所 有 模型 都 是 错 的 "， 或 者 用 贝 叶 斯 的 术 








(D 此 外 ,神经 网 络 的 性 质 也 强烈 依赖 于 这 种 数学 模型 的 截断 。 因 此 ,人 
， 那 么 “符合 数学 的 ”神经 网 络 的 VC 维度 至 少 是 0Q (nw)， 而 对 于 实数 权 值 的 任何 有 限 截 
RASE TH VC 维度 变 成 只 有 O(n)。 


边 











身 设 某 个 神经 网 络 有 nn 条 





























© 用 











数学 术语 说 的 话 ， 这 种 渐 近 展开 对 应 的 是 泰勒 - 拉 格 朗 日 近似 。 例 如 ,我 们 考虑 一 个 无 限 
次 可 导 的 函数 计 展 一 民 。 这 个 函数 了 在 点 加 处 的 “线性 化 ”对 应 的 就 是 将 xo 周围 的 函数 值 
近似 为 (x) z foe). +f "(xo)(x 一 x0)。 通 过 下 面 的 公式 提取 高 阶 项 ， 我 们 可 以 得 到 更 好 的 近似 : 




















n fl) 
FG) Y e (ss y. 泰勒 一 拉 格 庆 日 定理 量化 了 这 些 近似 的 误差 有 多 小 。 


to k! 


© ”更 准确 地 说 ， 这 应 该 是 时 空 曲率 极 小 的 情况 。 
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语 来 说 ， 绝 对 不 能 将 所 有 置信 度 都 放 到 同一 个 模型 中 。 





不 止 于 此 ， 纯 粹 贝 叶 斯 主义 者 实际 上 几乎 不 会 对 牛顿 运动 定律 赋予 任何 置信 
度 ， 因 为 这 些 定律 可 以 解释 的 事物 严格 少 于 广义 相对 论 与 量子 力学 的 某 种 得 当 的 











结合 〈 即 使 不 太 稳 固 ) 可 以 解释 的 事物 ， 而 在 描述 上 却 不 会 明显 更 简洁 。 





实用 主义 的 限制 

















纯粹 贝 叶 斯 主义 者 的 问题 在 于 不 实际 。 回 想 一 下 ， 纯 粹 贝 叶 斯 主义 者 最 纯 























的 形式 就 是 所 罗 门 诺 夫 妖 ,但 它 是 违反 物理 定律 的 ! 其 中 一 点 就 是 ， 纯 粹 贝 中 





LE 


Hr 





主义 者 在 进行 必需 的 计算 时 并 不 受 时 间 的 限制 ， 她 可 以 瞬间 解 开 量子 场 和 时 空 曲 








率 的 方程 ， 或 者 确定 第 古 戈 尔 个 素数 。 





然而 在 现实 中 ， 计 算 能 力 是 有 限 的。 我 们 之 前 也 看 到 了 ,在 地 球 上 执行 超过 
10? 个 计算 步骤 是 种 不 切实 际 的 愿望 。 这 就 大 大 降低 了 我 们 用 贝 叶 斯 公式 进行 计 
算 的 能 力 。 如 果 纯 粹 贝 叶 斯 主义 者 希望 研究 所 有 可 以 用 不 超过 1000 个 字符 描述 的 
理论 (大概 两 三 页 )， 那么 她 就 必须 对 其 中 每 个 理论 都 计算 似 然 项 PLDIT] ! 然而 









































这 些 理论 的 数目 无 比 庞 大 。 假 设 我 们 只 用 到 26 个 字母 ， 这 就 对 应 着 260 个 到 








He 


的 素材 。 这 样 的 话 ， 纯 粹 贝 叶 斯 主义 者 就 必须 至 少 进行 26' 次 计算 。 这 在 物理 上 





是 远 远 不 可 能 的 。 











然而 ， 我 们 回顾 一 下 ， 纯 粹 贝 叶 斯 主义 者 在 这 里 要 处 理 的 不 仅 是 能 用 1000 个 字 
符 表达 的 理论 。 作 为 比较 ， 人 类 大 脑 包含 大 约 105 个 突 触 ， 这 意味 着 对 大 脑 的 完整 
描述 至 少 需要 105 比特 的 信息 。 研 究 所 有 包含 这 么 多 字符 的 理论 ， 至 少 需要 VU 次 计 


算 ! 因此 ， 即 使 能 用 到 十 苹 尔 个 宇宙 ， 对 这 些 理论 应 用 贝 叶 斯 公式 也 完全 是 一 种 幻想 。 



































图 灵 的 机 器 学 习 


1950 年 ， 艾 伦 ' 图 灵 将 这 个 关于 算法 不 可 避免 的 复杂 度 的 论证 过 程 漂亮 地 
转移 到 了 人 工 智能 问题 上 。 在 一 篇 发 表 在 期 刊 《 心 灵 : 心理 学 与 哲学 季度 评论 》 
(Mind, a Quarterly Review of Psychology and Philosophy) 上 ， 题 为 《计算 机 制 与 智 
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能 》(“Computing Machinery and Intelligence”) 的 论文 中 ， 图 灵 首 先 提出 了 一 个 与 
算法 执行 所 需 时 间 没 什么 关系 的 问题 :“ 机 器 能 思考 吗 ?” 图 灵 尝 试 回答 的 就 是 这 个 
问题 。 然 而 “思考 ”这 个 词 的 模糊 性 让 他 尝试 将 问题 精确 化 。 与 其 考虑 这 个 问题 ， 
图 灵 提 出 了 另 一 个 问题 ， 就 是 机 器 是 否 能 像 人 那样 行动 。 

更 准确 地 说 ， 图 灵 提 出 了 以 下 的 测试 : 要 求 一 位 人 类 4 与 另外 两 个 实体 和 
了 进行 书面 通信 ， 而 这 两 个 实体 和 和 了 了 分别 是 人 类 B 和 一 台 机 器 。 如 果 人 类 4 无 
法 分 辨 世 和 了 之 中 哪 一 个 实体 是 人 类 好 的话， 那么 机 器 就 通过 了 测试 。 换 句 话说 ， 
如 果 机 器 知道 怎么 模仿 人 类 ， 而 任何 人 类 都 无 法 分 辨 出 这 人 台 机 器 不 是 人 类 的 话 ， 
那么 机 器 就 成 功 通 过 了 测试 。 这 就 是 图 灵 所 谓 的 “模仿 游戏 " ， 我 们 今天 将 它 称 为 
图 灵 测 试 口 。 

在 论文 的 第 3 节 到 第 5 节 中 ， 图 灵 重 提 了 他 1936 年 的 工作 ， 严 格 定 义 了 机 器 
到 底 是 什么 一 一 这 个 概念 推动 了 计算 机 的 发 明 ， 接 着 就 是 数字 时 代 的 到 来 ! 然后 
在 论文 的 第 6 节 中 ， 图 灵 否 定 了 尝试 证 明 机 器 不 可 能 思考 的 9 个 经 典 论 证 。 但 更 
重要 的 是 ， 在 论文 的 第 7 节 ， 图 灵 预 料 到 了 其 测试 中 的 难点 及 解决 方法 。 即 使 仍 
然 不 能 说 计算 机 当时 已 经 存在 ， 但 图 灵 不 仪 已 经 预料 到 了 它们 会 在 未 来 出 现 ， 而 
且 还 预料 到 了 它们 以 后 的 性 能 将 足以 在 模仿 游戏 中 取胜 :“( 工程 上 的 进步 ) 似乎 不 
可 能 不 足够 ( 使 其 通过 测试 ),” 对 于 图 灵 来 说 ,“ 这 个 问题 主要 是 编程 问题 ”。 

特别 是 ， 图 灵 以 惊人 的 远见 推测 出 ， 能 成 功 通 过 图 灵 测 试 的 程序 代码 至 少 需 
要 大 概 10° 个 字符 来 描述 。 也 就 是 说 ， 用 我 们 在 第 7 章 引入 的 术语 来 说 ， 图 灵 自 
己 猜 测 ， 图 灵 测 试 的 所 罗 门 诺 夫 复杂 度 应 该 以 十 亿 字 节 来 计量 。 为 了 得 到 这 个 佑 
计 值 ， 图 灵 依 靠 的 是 他 所 知 的 唯一 一 台 能 通过 图 灵 测 试 的 机 器 。 对 ， 我 说 的 就 是 
人 类 大 脑 ! 毕竟 还 有 什么 能 比 人 类 更 善于 模仿 人 类 呢 ? 对 图 灵 来 说 值得 庆幸 的 是 ， 
当时 的 神经 科学 已 经 给 出 了 人 类 大 脑 复杂 度 的 估计 值 ， 提 出 人 类 的 神经 元 之 间 大 
AA 104 到 105 个 突 触 一 一 现代 的 佑 计 值 处 于 10 E 5 x 10 之 间 。 
图 灵 提 出 ， 只 有 一 小 部 分 突 触 对 于 通过 图 灵 测 试 来 说 是 必 不 可 少 的 ， 这 就 是 
需要 10° 个 字符 这 个 数字 的 来 历 。 图 灵 补 充 道 :“ 根 据 工作 时 的 节奏 ,我 每 天 大 概 
可 以 写 1000 个 字符 的 代码 ， 因 此 ，60 个 人 一 起 这 样 工作 50 年 ， 如 果 写 出 来 的 东 
西 都 没有 进 废 纸 繁 的 话 ， 就 能 完成 (编写 一 个 能 通过 图 灵 测 试 的 算法 的 ) 任务 。 
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更 为 迅速 的 方法 也 同样 可 取 。” 

图 灵 这 个 天 才 般 的 灵光 一 内 并 非 只 对 图 灵 测 试 适用 。 可 以 打赌 ,许多 任务 同 
样 需要 非常 长 的 程序 才能 解决 ， 比 如 说 对 自然 语言 的 掌握 、“ 常 识 ” 的 内 化 以 及 共 
情 的 艺术 。 更 不 妙 的 是 对 于 某 些 任务 ， 尤 其 是 生物 学 和 社会 科学 中 的 任务 来 说 ， 
可 能 需要 长 度 超过 人 类 大 脑 大 小 的 算法 才能 解决 。 这 样 的 话 ， 不 仅 我 们 写 出 来 的 
算法 无 效 ， 而 且 大 脑 也 必然 无 法 解决 这 些 任务 。 

预测 下 一 次 金融 危机 可 能 就 超出 了 我 们 大 脑 那 有 限 的 认 知 能 力 。 “如 果 人 们 不 
相信 数学 很 简单 ， 那 是 因为 他 们 没有 意识 到 生活 有 多 复杂 。” 298g - 5 RE Un 
是 说 。 这 个 断言 可 以 用 严谨 的 形式 表达 ， 方 法 就 是 测量 不 同学 科 的 所 罗 门 诺 夫 复 
杂 度 "一 一 或 者 第 18 章 引 入 的 所 罗 门 诺 夫 精致 度 ， 它 更 合适 ! 

我 们 回 到 图 灵 的 研究 。 同 样 出 于 他 无 比 的 智慧 ， 图 灵 注 意 到 人 类 大 脑 能 够 通 
过 图 灵 测 试 。 于 是 他 猜测 ， 通 过 模仿 人 类 大 脑 成 功 完成 图 灵 测 试 ， 我 们 能 更 好 地 
构建 能 够 通过 测试 的 机 器 。 然 而 图 灵 也 注意 到 ， 儿 童 教 育 同样 是 大 脑 最 终 发 育 过 
程 中 的 重要 一 环 。 “儿童 的 大 脑 可 能 类 似 于 我 们 在 文具 店 买 到 的 笔记 本 ,” 图 灵 这 
样 写 道 ,“ 没 什么 机 关 ， 但 有 许多 张 白 纸 >。” 图 灵 从 而 提出 ， 为 了 帮助 机 器 填 满 它 
自己 的 白 纸 ， 可 以 让 它 从 数据 中 学 习 。 和 学习 机 絮 的 概念 ， 也 就 是 能 够 学 习 的 机 融 ， 
就 此 诞生 。 

因此 ， 学 习 机 器 这 个 想法 能 够 让 机 器 自己 写 出 包含 数 十 亿 字 符 的 程序 一 一 必 
要 时 可 以 写 得 更 长 。 用 更 贴近 算法 的 语言 来 说 ， 这 相当 于 肯定 了 机 器 学 习 最 终 可 
以 让 我 们 研究 并 探索 那些 描述 长 度 超过 十 亿 比 特 的 算法 。 而 更 关键 的 是 ， 引 导 这 
种 探索 的 并 非 程序 员 的 指 尖 ， 而 是 原始 数据 ， 就 像 儿童 接收 到 的 那样 。 

需要 特别 指出 ， 图 灵 的 这 段 论证 反 驶 了 众多 知识 分 子 的 想法 ， 其 中 还 包含 
一 些 专家 ， 他 们 经 常 这样 说 :“ 机 器 学 习 效 果 不 错 但 数学 家 不 知道 为 什么 。 
这 是 2015 年 《 连 线 》( Jired) 杂志 上 一 篇 文章 的 标题 。 然 而 早 在 1950 年 ， 艾 
E + 图 灵 就 预言 了 机 器 学 习 未 来 会 取得 成 功 ， 甚 至 明确 指出 它 会 在 20 AV 
现 ! 更 厉害 的 是 ， 关 于 机 天 学 习 会 在 众多 任务 中 超越 人 类 编写 的 程序 这 一 情况 ， 网 
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© 不 巧 的 是 ,停机 问题 会 导致 所 罗 门 诺 夫 复杂 度 无 法 计算 。 
D 我 们 将 在 第 19 章 看 到 这 个 观点 现在 已 经 被 神经 科学 否定 ， 根 据 正 是 贝 叶 斯 的 原则 ! 
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空 间 Ie o 


同样 ， 某 些 专家 经 常 指责 那 些 庞大 的 神经 网 络 无 法 被 明志 





周 了 它 的 确切 原因 : 只 有 机 器 学 习 才 能 探索 那些 长 度 超过 十 亿 字 节 的 算法 








解释 。 然 而 ， 巨 大 

















而 高 效 的 神经 网 络 无 法 用 寥寥 几 个 字符 描述 出 来 ， 至 少 无 法 以 准确 的 方式 描述 出 


K, 这 并 不 令 人 意外 。 














这 是 因为 ， an 




















神经 网 络 能 被 简单 描述 的 话 ， 这 个 不 太 长 
的 描述 就 会 是 简短 的 一 种 算法 ， 它 能 够 生成 另 一 个 算法 〈 神 经 网 络 )， 并 借 此 解决 
图 灵 测 试 之 类 的 问题 。 这 样 的 话 ， 这 个 简短 的 算法 就 能 解决 
门 刚才 推测 ， 这 项 测试 无 法 被 简短 的 算法 解决 。 
现在 剩 下 的 就 是 明确 指出 用 什么 方法 来 探索 长 度 
而 艾 伦 ' 图 灵 并 没有 指出 要 做 到 这 一 点 可 以 使 用 的 方法 ， 他 只 是 出 
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巨大 的 算法 组 成 的 空间 。 然 


言 学 习 能 力 将 


会 是 关键 。 在 21 世纪 初 ， 人 们 提出 了 大 量 的 方法 。 我 们 之 前 已 经 谈 到 过 其 中 几 


种 。 不 分 先后 的 话 ， 我 们 可 以 举 出 线 色 
支持 向 量 机 、 神 经 网 络 、 贝 叶 
面 几 章 中 再 详细 讨论 最 后 这 三 个 

现在 ， 我 重复 一 下 纯粹 贝 中 
多 为 10 个 字符 的 算法 ， 纯 粹 贝 中 
样 做 所 需 的 计算 量 ( 远 远 ) 大 于 2 ”， 即 使 用 到 古 区 尔 个 字 害 
间 ， 这 种 计算 量 也 实在 不 现实 。 因 此 ， 如 
1 利用 纯粹 贝 叶 斯 主义 者 的 方法 来 解决 图 





年 龄 长 得 多 的 时 


测试 的 所 罗 门 诺 夫 复杂 度 ， 那么 在 现实 
灵 测 试 的 话 ， 得 到 的 结 


实用 贝 叶 斯 主义 


为 了 解决 像 图 





灵 测 试 那样 拥有 

















机 融 学 习 算法 
































果 必 然 是 失败 。 
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巨大 的 所 罗 门 诺 夫 复杂 度 的 问题 ， 











主义 者 只 能 放弃 贝 叶 其 


中公 式 。 他 更 应 该 利 有 








方法 。 由 此 我 们 需要 调整 “有 用 ” 
H; 但 对 于 实用 贝 叶 斯 3 
实际 上 并 没有 用 。 因 此 ， 实 


度 高 的 理论 就 是 有 用 上 
算 时 间 超 出 常理 的 理 ; 





这 个 概念 。 
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斯 网 络 ， 还 有 马尔 可 夫 随 机 场 。 我 们 会 在 本 章 和 后 


斯 主义 者 提出 的 建议 。 即 使 只 能 考虑 那些 长 度 至 
斯 主义 者 也 会 希望 测试 并 比较 所 有 这 些 算法 。 这 


， 花 上 比 这 些 宇 宙 的 
图 灵 正 确认 识 到 了 其 

















实用 贝 叶 斯 


那些 所 需 时 间 没 有 超出 现实 可 能 性 的 
XT Atos DT M 
义 者 来 说 ， 置 信 度 很 高 ， 但 所 需 计 
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了 所 需 计算 时 间 较 短 的 理论 之 中 更 可 信和 的 那 一 部 分 。 

这 就 让 我 们 能 够 解释 素数 定理 给 出 的 近似 以 及 牛顿 运动 定律 在 实用 中 的 置信 
度 了 。 对 于 纯粹 贝 叶 斯 主义 者 来 说 ， 这 两 种 描述 都 没有 任何 用 处 ， 因 为 两 者 分 别 
被 素数 的 精确 计算 以 及 爱 因 斯 坦 的 广义 相对 论 超越 。 然 而 实用 贝 叶 斯 主义 者 则 乐 
于 拥抱 这 些 近似 方法 ， 因 为 它们 对 计算 的 需求 明显 小 得 多 。 计 算 n/In(n) 的 近似 值 
需要 的 时 间 是 n 的 对 数 ， 而 牛顿 理论 中 的 向 量 和 微分 计算 与 爱 因 斯 坦 理论 中 的 张 
量 计 算 相 比 远 远 更 快 。 只 要 在 我 们 身 处 的 场景 中 ， 这 两 种 近似 精确 到 足以 被 接受 
(分 别 是 值 很 大 的 情况 和 弱 引 力 的 情况 )， 那 么 对 于 实用 贝 叶 斯 主义 者 来 说 ， 这 
两 种 近似 就 比 精确 的 版 本 更 有 用 ! 

这 种 与 计算 时 间 有 关 的 “有 用 ”概念 同样 可 以 作为 对 神经 网 络 惊人 的 成 功 的 
首要 解释 。 这 是 因为 ， 神 经 网 络 , 或 者 至 少 是 所 谓 的 前 馈 神 经 网 络 ， 与 那些 更 精 
细 的 算法 相反 ,需要 的 计算 时 间 不 长 ， 而 且 必 定 有 所 限制 (图 14.1 )。 实 际 上 ， 如 
果 我 们 考虑 前 馈 神 经 网 络 的 一 个 足够 广泛 的 定义 ， 那么 这 些 网 络 组 成 的 集合 恰好 
就 是 快速 并 行 算 法 的 集合 。 因 此 ， 在 前 馈 神 经 网 络 上 进行 机 器 学 习 ， 其 实 就 相当 
于 利用 快速 算法 尽 可 能 好 地 对 数据 进行 解释 ( 如 果 可 能 的 话 ， 也 要 利用 合适 的 贝 
叶 斯 先 验 置信 度 )。 所 以 ， 这 就 是 迈 向 实用 贝 叶 斯 主义 的 第 一 步 。 
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图 14.1 神经 网 络 就 是 神经 元 之 间 一 系列 通信 以 及 神经 元 本 身 进行 的 基本 计算 的 总 和 。 如 
果 这 种 通信 和 是 无 环 的 ， 我 们 就 说 这 是 个 前 馈 神经 网 络 ， 从 直觉 上 来 说 ， 也 就 是 通 
信 只 会 朝 一 个 方向 进行 ， 从 来 不 会 形成 一 个 闭环 








神经 网 络 并 非 唯 一 的 快速 算法 。 计 算 线性 回归 同样 能 快速 得 到 预测 ， 但 它 可 能 
有 点 太 快 了 。 在 我 和 拉 希 德 . 格拉 维 合 作 的 一 篇 论文 中， 我 们 其 至 确定 了 众多 机 
器 学 习 方法 的 共同 弱点 ， 就 是 它们 考虑 的 算法 有 着 严格 限制 ， 在 并 行 化 之 后 计算 时 
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间 只 有 寥寥 儿 步 。 问 题 在 于 ， 这 样 我 们 就 忽略 了 所 有 运行 更 慢 的 算法 。 然 而 ， 出 于 
某 些 原因 (我 们 会 在 第 18 章 再 谈 到 )， 我 们 可 以 打赌 ,在 分 析 原 始 数据 以 及 解决 某 
些 对 我 们 来 说 重要 的 问题 时 用 到 的 许多 关键 算法 ， 其 实 必然 是 相对 较 慢 的 算法 。 这 
一 点 将 引出 一 个 深度 学 习 获 得 成 功 的 理论 解释 。 我 们 之 后 会 再 谈 到 。 

















次 线性 算法 








到 这 里 为 止 ， 我 非常 感 兴趣 的 还 是 那些 有 可 能 获得 置信 和 度 的 算法 的 性 质 。 我 
同样 确定 ， 要 寻找 最 优 预 测算 法 ， 转 积 海量 数据 是 必 不 可 少 的 。 

然而 ， 并 不 是 所 有 数据 都 有 价值 。 就 像 在 沙漠 深 处 安装 的 监视 摄像 头 传 来 的 视频 
流 那样 ， 实 际 上 绝 大 部 分 收集 来 的 数据 毫 无 意义 。 问 题 在 于 ， 在 这 个 大 数据 的 时 代 ， 
单单 读 取 这 些 没 有 意义 的 数据 来 验证 它们 ， 真 的 没有 意义 ， 所 需 的 时 间 就 已 经 不 切实 
际 了 一 一 我 就 是 这 样 说 服 自己 不 去 查阅 收 到 的 全 部 邮件 ， 这 种 做 法 没 问 题 的 ! 

为 了 解决 这 个 问题 ， 理 论 计算 机 学 家 将 注意 力 投向 了 所 谓 的 次 线性 算法 。 这 
些 算法 的 特点 就 是 在 不 花 时 间 读 取 所 有 数据 的 情况 下 ， 仍 然 能 够 提取 数据 集 里 最 核 
心 的 内 容 。 也 就 是 说 ， 这 些 算法 能 够 在 读 取 输入 数据 时 “一 目 十 行 ”。 

这 种 算法 在 历史 上 最 典型 的 例子 就 是 谷歌 的 算法 。 在 谷歌 上 搜索 几乎 瞬间 就 
能 得 到 结果 ， 然 而 ,谷歌 的 数据 库 包含 了 互联 网 的 数 百 万 亿 网 页 中 相当 大 的 一 部 
分 。 对 于 谷歌 来 说 ， 在 向 用 户 返 回 结果 之 前 探索 整个 数据 库 根本 不 在 考虑 范围 之 
内 ， 因 为 这 样 做 要 花 上 几 天 时 间 ! 因此 ， 谷 歌 的 搜索 算法 必须 是 次 线性 的 。 

谷歌 用 到 的 技巧 跟 图 书馆 和 词典 一 样 ， 就 是 预先 对 数据 库 排 序 和 整理 ， 迅 速 
完成 对 数据 库 的 查阅 。 比 如 说 ， 词 典 将 单词 按照 字母 顺序 整理 ， 就 能 让 使 用 者 很 
快 知道 希望 查找 的 单词 应 该 会 在 什么 地 方 。 更 厉害 的 是 ， 利 用 字母 顺序 ， 给 定 词 
典 中 的 一 页 以 及 要 查找 的 单词 ， 使 用 者 就 能 知道 这 个 单词 应 该 在 词典 中 这 一 页 的 
前 面 还 是 后 面 。 一 般 来 说 ， 在 (按照 全 序 关 系 ) 排序 过 的 数据 库 中 查找 数据 非常 
迅速 。 所 谓 的 二 分 算法 ( 大概 就 是 你 用 词典 查 单词 的 时 候 用 的 方法 ) 的 计算 时 间 
是 数据 库 大 小 的 对 数 。 

然而 谷歌 、 图 书馆 管理 员 和 词典 使 用 的 算法 都 需要 预先 进行 大 量 的 计算 。 要 
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将 所 有 网 页 整理 并 排序 ， 除 非 对 其 全 部 访问 ， 否 则 不 可 能 做 到 。 即 使 如 此 ， 我 们 
能 否 在 既 不 检索 整个 数据 集 ， 也 不 预先 对 其 进行 处 理 的 前 提 下 ， 将 有 用 的 信息 提 
取出 来 呢 ? 令 人 惊讶 的 是 ， 对 于 某 些 有 用 的 信息 以 及 某 些 数据 来 说 ， 答 案 是 肯定 
的 。 傅 里 叶 变换 就 属于 这 种 情况 。 

在 19 世纪 初 ， 约 瑟 夫 ' 傅 里 叶 等 人 就 兽人 研究 过 傅 里 叶 变 换 ， 它 是 一 种 对 声 
音 、 图 像 、 视 频 以 及 股票 走势 等 信号 的 描述 方式 进行 变换 的 方法 外 。 我 们 在 这 里 
就 只 讨论 声音 信号 。 

声音 可 以 通过 鼓膜 附近 气压 的 变化 来 描述 。 但 还 有 男 一 种 等 价 的 描述 方式 ， 
它 对 于 音乐 的 谱写 来 说 特别 简单 ， 那 就 是 利用 组 成 声音 的 频率 来 描述 这 个 声音 。 
傅 里 叶 变换 就 像 一 个 双语 词典 ， 能 够 将 声音 的 振动 变化 描述 转换 为 频率 描述 。 这 
样 的 翻译 有 着 很 多 用 途 ， 一 个 原因 是 要 改善 声音 的 话 ， 调 整 频 率 通 常 比 调整 振动 
更 有 效 ， 另 一 个 原因 就 是 声音 通常 只 由 为 数 不 多 的 几 个 频率 组 成 。 

实际 上 ， 傅 里 叶 变换 已 经 占据 了 我 们 的 日 常生 活 ， 据 理 查 德 ， 巴 拉 纽 克 教 授 
所 言 ， 就 连 我 们 的 计算 机 和 电话 每 天 都 会 进行 数 十 亿 次 傅 里 叶 变 换 。 在 每 次 听 音 
乐 、 查 看 数字 化 图 像 ， 或 者 观看 视频 的 时 候 ， 我 们 都 在 让 机 器 进行 傅 里 叶 变 换 。 

因此 ， 计 算 傅 里 叶 变 换 的 算法 如 果 有 任何 加 速 的 可 能 性 ， 都 会 在 程序 计算 或 
者 计算 所 需 硬 件 的 方面 带 来 数 十 亿 欧 元 的 收益 ， 更 不 用 说 用 户 节 省 下 来 的 等 待 时 
间 了 。 在 1964 年 ， 詹姆斯. 库 利 和 约翰 图 基 就 完成 了 一 项 壮举 ， 大 幅 缩短 了 
(离散 ) 傅 里 叶 变换 的 计算 时 间 。 尽 管 最 简单 的 算法 需要 的 时 间 与 数据 量 的 平方 成 
正比 ， 但 库 利 和 图 基 的 算法 ， 又 叫 快速 傅 里 叶 变换 ， 可 以 在 接近 线性 的 时 间 内 完 
成 "。 也 就 是 说 ， 要 对 一 百 万 字 节 (1MB ) 的 数据 进行 计算 的 话 ， 快 速 傅 里 叶 变 换 
只 需要 数 百 万 次 运算 ( 对 于 现代 计算 机 来 说 ， 这 相当 于 几 毫 秒 的 计算 )， 而 不 是 朴 
素 算法 所 需 的 100 万 乘 以 100 万 次 运算 ( 差不多 1 分 钟 的 计算 )。 

然而 在 大 数据 的 时 代 ， 快 速 傅 里 叶 变换 还 是 太 慢 了 ,尤其 在 处 理 上 十 亿 字 
(GB) 甚至 上 万 亿 字 节 (TB ) 的 数据 时 更 是 如 此 。 我 们 能 不 能 让 传 里 叶 变 换 变 
比 现 在 更 快 ? 在 2012 年 ， 哈 桑 尼 耶 、 因 迪克 、 卡 塔 比 和 普 赖 斯 四 发现 ,答案 是 肯 








































































































Er 
BE 
4H 











Tr 
































中 ”也 就 是 说 离散 傅 里 叶 变换 所 需 的 时 间 复 杂 度 从 O(n ) 变 成 了 O(n log n)« 
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定 的 。 也 可 以 说 他 们 提出 了 一 个 巧妙 的 算法 ， 可 以 对 信号 最 主要 的 上 个 频率 进行 
近似 计算 ， 而 需要 的 时 间 大 概 在 丰 乘 以 数据 量 的 对 数 这 个 数量 级 “。 重 点 在 于 ， 这 
个 叫 作 稀疏 傅 里 时 变换 的 精妙 算法 的 运行 时 间 是 次 线性 的 ， 也 就 是 说 它 几 乎 忽略 
了 整个 待 处 理 的 信号 ， 却 能 得 知 这 个 信号 大 概 是 什么 。 














思考 的 多 种 模式 














虽然 次 线性 算法 在 计算 机 科学 中 仍 不 是 主流 ， 但 我 们 的 大 脑 似 乎 喜欢 使 用 这 
种 算法 。 谁 又 未 兽 一 目 十 行 读 完 书面 材料 ， 漫 不 经 心地 听 别 人 讨论 ， 或 者 吃饭 时 
根本 没有 在 意 食 物 的 味道 呢 ? 奇怪 的 是 ， 有 时 候 文章 中 的 某 些 词语 、 讨 论 中 的 某 
些 话题 或 者 食物 中 的 某 些 味道 会 吸引 我 们 的 注意 力 。 当 这 种 情况 出 现 的 时 候 ， 我 
们 似乎 突然 就 切换 到 了 思考 状态 。 我 们 会 开始 使 用 更 缓慢 、 更 精确 的 算法 来 仔细 
分 析 文 章 的 含义 、 讨 论 的 深意 与 本 地 特色 菜 的 独特 味道 。 

我 在 这 里 描述 的 ， 正 是 诺 贝尔 经 济 学 奖 得 主 丹尼尔 . 卡 内 曼 的 杰作 《思考 ， 
快 与 慢 》 的 核心 。 卡 内 曼 区 分 了 两 套 思考 系统 : 系统 一 和 系统 二 。 系 统一 就 像 稀 
芒 傅 里 叶 变换 ， 非 常 迅速 、 有 效 、 勤 奋 ， 但 有 可 能 出 现 严 重 错 误 ;， 系统 二 就 像 精 
确 傅 里 叶 变换 ,很 慢 且 需要 大 量 能 量 ,， 懒 惰 但 更 正确 。 

据 卡 内 曼 所 说 ， 我 们 通常 会 将 自己 等 同 于 系统 二 ， 而 且 几 乎 不 会 意识 到 系统 
一 的 存在 。 然 而 ， 在 绝 大 部 分 时 间 内 主导 的 都 是 系统 一 ， 而 这 会 让 我 们 经 常 犯错 。 
试 试 这 个 : 球拍 和 球 的 价格 一 共 是 1.1 欧元 ， 球 拍 的 价格 比 球 高 1 欧元 ， 那 么 球 的 
价格 是 多 少 ? 

很 可 能 你 立刻 就 看 到 了 管 案 , 但 这 个 答案 是 错 的 。 根 据 卡 内 曼 所 说 ， 如 果 这 
种 情况 出 现 ， 那 是 因为 系统 一 匆匆 忙 忙 给 出 了 第 一 个 想到 的 答案 ; 只 有 在 之 后 ， 
也 许 是 当 你 看 到 这 里 的 时 候 ， 你 的 系统 二 才 会 开始 质疑 系统 一 。 

我 们 可 能 会 认为 卡 内 曼 希 望 说服 我 们 放弃 系统 一 ， 尽 可 能 经 常 让 系统 二 运作 。 
并 非 完 全 如 此 。 毕 竞 即 使 系统 二 得 出 的 结果 更 正确 ,但 对 于 大 脑 来 说 ， 使 用 系统 
























































(D 它 的 复杂 度 实际 上 是 O(K log! n). 
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二 更 疲劳 。 思 考 有 其 代价 。 然 而 ， 正 如 所 有 演员 、 钢 琴 家 和 冲浪 者 都 知道 的 那样 ， 
我 们 不 可 能 一 一 思考 自己 的 所 有 行为 与 动作 。 我 们 最 终 必须 能 够 自然 且 自 发 地 做 
出 这 些 动 作 ， 无 须 大 量 有 意识 的 思考 。 

要 做 到 无 须 长 久 思考 就 能 做 出 合格 的 动作 ， 演 员 、 钢 琴 家 和 冲浪 者 用 的 是 同 
样 一 套 方法 : 他 们 的 系统 二 会 迫使 系统 一 学 习 所 需 的 动作 。 对 于 那些 希望 学 习 或 
者 授课 的 人 来 说 ， 这 可 能 是 最 重要 的 意见 。 与 其 说 学 习 是 将 信息 塞 进 脑 中 ， 不 如 
说 是 让 系统 二 来 教导 系统 一 ， 使 得 系统 一 发 现 一 条 捷径 ， 能 够 迅速 解决 那些 系统 
二 已 经 知道 怎么 解决 ， 但 要 花 上 许多 时 间 和 能 量 的 问题 。 也 就 是 说 ， 学 习 的 根本 
就 是 发 现 又 快 又 ( 足够 ) 好 的 捷径 。 





















































迈进 后 严谨 阶段 ! 





数学 的 学 习 似乎 也 是 如 此 进行 的 。 在 今天 ， 如 果 有 人 问 我 一 个 关于 加 法 、 指 
数 或 者 图 灵机 的 问题 ， 那 么 对 我 来 说 ， 不 通过 系统 二 就 能 回答 这 些 问题 也 并 非 这 
无 可 能 。 这 是 因为 ， 长 年 以 来 我 的 系统 二 已 经 成 功 教 会 系统 一 如 何在 不 花费 脑力 
劳动 的 前 提 下 回答 这 些 问 题 ! 我 的 大 脑 中 储存 着 大 量 捷径 ， 能 用 于 解决 大 量 数学 
问题 ， 即 使 是 那些 对 于 年 轻 学 生来 说 略 感 困难 的 问题 。 某 些 人 把 这 种 能 力 称 为 数 
学 能 力 ， 还 有 些 人 把 它 称 为 数学 直觉 。 我 更 愿意 把 它 称 为 系统 二 通过 努力 发 现 的 
高 效 捷径 。 

但 这 不 是 系统 一 的 数学 训练 中 最 重要 的 方面 。 数 学 家 、 菲 尔 兹 奖 获 得 者 陶 哲 
轩 在 他 的 博客 中 5 将 数学 学 习 分 为 三 个 阶段 ， 分 别 叫 作 前 严谨 阶段 、 严 谨 阶 段 和 
后 严谨 阶段 。 简 单 来 说 ， 学 生 首先 会 开始 摆弄 数字 和 数学 概念 ， 而 不 会 忧心 于 自 
己 执行 的 那些 代数 操作 的 有 效 性 。 然 后 ， 随 着 时 间 流 逝 以 及 接受 的 数学 教育 越 来 
越 多 ， 严 并 性 的 时 刻 就 会 到 来 ， 而 且 很 快 会 转变 为 纯粹 主义 : 一 切 都 应 该 用 形式 
化 的 语言 做 出 解释 。 最 后 ， 后 严谨 阶段 属于 人 研究 者 ， 他 们 花 上 大 部 分 时 间 构 建 不 
同 的 启发 式 论证 ， 用 来 得 出 定理 证 明 的 大 体 轮廓 ， 其 间 会 暂时 舍弃 之 前 学 到 的 形 
式 体 系 。 关 键 在 于 ， 第 二 个 阶段 似乎 是 到 达 第 三 个 阶段 的 必 经 之 路 。 

陶 哲 轩 的 说 法 可 以 用 系统 一 和 系统 二 的 语言 来 理解 。 前 严谨 阶段 对 应 的 是 系 













































































222 | 贝 叶 斯 的 博弈 : 数学 、 思 维 与 人 工 智能 








统一 和 系统 二 都 没有 学 会 严谨 性 的 情况 。 当 系统 二 发 现 严 谨 性 及 其 重要 性 时 ， 严 
并 阶段 就 开始 了 。 在 这 个 阶段 中 ， 系 统 二 会 教导 系统 一 ， 让 它 意识 到 自身 直觉 的 
局 限 性 。 但 更 重要 的 是 ， 系 统一 会 由 此 学 会 测量 自身 的 置信 和 度 ， 这 样 就 能 够 更 好 
地 做 出 决定 ， 判 断 自己 能 解决 问题 ,还 是 需要 向 系统 二 求助 。 只 有 经 过 这 种 困难 
的 学 习 过 程 ， 系 统一 才能 成 为 系统 二 的 完美 协助 者 ， 而 不 会 在 重要 的 时 候 拖 后 腿 。 
因此 ， 成 为 一 名 优秀 的 数学 家 ， 基 本 上 相当 于 让 系统 一 足以 在 这 方面 胜任 一 一 但 
要 达到 这 一 状态 ， 严 说 阶段 必 不 可 少 。 

话 虽 如 此 ， 即 使 到 了 后 严谨 阶段 ， 系 统 二 仍 会 不 断 教导 系统 一 ， 让 它 能 够 进步 。 
这 就 是 在 莱 姆 基 ' 奥利弗 和 孙 达 拉 拉 人 詹 发 表 了 关于 素数 最 后 一 位 数字 的 研究 结果 之 
后 ， 所 有 数论 学 家 的 大 脑 中 发 生 的 事情 。 这 个 发 现 惊动 了 数论 学 家 的 系统 一 ， 它 关 
于 素数 的 直觉 基于 素数 定理 ， 而 这 一 捷径 预言 相 邻 素数 的 最 后 一 位 数字 大 多 是 独立 
的 。 在 这 个 情况 下 ， 这 个 捷径 出 错 了 。 自 此 之 后 ， 数 论 学 家 可 能 进行 了 某 种 近似 贝 
叶 斯 推断 ， 以 减少 素数 定理 这 一 捷径 在 相 邻 素数 的 情况 中 应 用 的 置信 度 。 

丹尼尔 ' 卡 内 曼 的 双 系统 思考 模型 对 于 实用 贝 叶 斯 主义 者 来 说 的 确 很 有 趣 。 
当然 ， 这 个 模型 是 错 的 。 但 毕竟 “所 有 模型 都 是 错 的 "。 然 而 卡 内 曼 的 模型 似乎 很 
有 用 一 一 即使 第 17 章 上 暗示 还 存在 负责 创造 性 思考 过 程 的 第 三 个 系统 。 

在 实践 中 ， 尤 其 是 在 面 对 大 数据 的 时 候 ， 大 部 分 用 到 的 算法 大 概 是 迅速 的 局 
发 式 算 法 ， 其 至 是 次 线性 的 。 然 而 拥有 更 缓慢 但 更 正确 的 算法 仍然 是 必要 的 。 此 
外 ， 如 果 我 们 拥有 数 个 更 缓慢 、 但 我 们 知道 足够 正确 的 算法 ， 那 么 我 们 就 可 以 用 
这 些 算 法 来 训练 那些 快速 的 启发 式 算法 。 

假如 我 能 打 个 赌 ，( 作为 合格 的 贝 叶 斯 主义 者 ， 我 喜欢 打赌 ! ) 我 会 说 这 就 是 
未 来 人 工 智能 的 模样 。 





















































































































































































































































贝 叶 斯 的 近似 


因此 ， 实 用 贝 叶 斯 主义 者 会 对 他 研究 的 现象 进行 大 量 模拟 。 然 而 ， 他 必须 做 
最 重要 的 近似 就 是 对 那个 能 让 他 学 习 的 公式 的 近似 : 他 必须 找到 对 贝 叶 斯 公式 
行 近似 计算 的 方法 。 我 们 可 以 大 体 找 出 五 种 方法 。 
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第 一 种 方法 就 是 限制 候选 模型 的 数量 。 这 个 数量 的 上 限 可 以 很 大 一 一 我 们 可 
以 考虑 上 万 甚至 上 亿 个 候选 模型 。 然 而 ， 为 了 能 够 对 贝 叶 斯 公式 进行 精确 计算 ， 
这 个 数量 不 能 以 指数 增长 ， 当 然 也 不 能 像 带 有 参数 的 模型 那样 有 无 限 个 。 这 个 方 
法 一 般 会 以 我 们 之 前 说 到 的 积 性 权重 更 新 算法 作为 补充 。 
第 二 种 方法 相当 于 只 计算 某 个 置信 度 很 高 的 模型 ， 甚 至 是 找 出 最 可 靠 的 模 
型 。 这 就 是 我 们 在 第 12 章 看 到 的 所 谓 “ 最 大 后 验 模型 ”。 也 就 是 说 ， 会 搜索 使 
得 PLT|D] 最 大 化 的 预测 性 理论 7。 然而 ,我 们 有 很 多 算法 能 够 最 大 化 这 一 类 数 
量 ， 比 如 梯度 下 降 法 ( gradient descent )、 最 大 期 望 ( expectation maximization， 简 
称 EM ) 算法 ， 以 及 生成 式 对 抗 网 络 ( generative adversarial network， 以 下 简称 
GAN); 但 别 忘 了 ， 后 验 最 大 化 方法 只 是 贝 叶 斯 公式 的 粗略 近似 ， 尤 其 是 ， 它 只 停 
留 在 单一 的 模型 下 ， 所 以 它 会 落 入 过 度 拟 合 的 区 域 。 
第 三 种 方法 在 于 忽略 配 分 函数 ， 它 作为 贝 叶 斯 公式 的 分 母 ， 需要 对 所 有 可 以 
想象 的 模型 进行 比较 。 这 样 的 话 ， 不 同 模 型 的 权 值 之 和 可 以 不 等 于 1。 我 们 之 后 在 
第 17 章 会 特别 看 到 ， 即 使 在 这 种 情况 下 ， 利 用 所 请 的 MCMC 算法 或 者 对 比 散 度 
( contrastive divergence ) 算法 ， 我 们 仍然 能 够 进行 预测 。 

我 这 里 想 提 到 的 第 四 种 方法 是 最 奇怪 的 ， 它 允许 自身 不 按照 概率 法 则 进行 计 
jk. SERA D MEE WTE 2014 年 提出 的 方法 就 是 这 样 的 例子 ， 它 修改 了 条 件 
概率 的 定义 ， 人 允许 不 满足 贝 叶 斯 公式 的 概率 运算 由 。 所 谓 的 平方 和 算法 (sum of 
squares algorithm ) 也 属于 类 似 的 类 型 ， 博 阿 效 ' 巴 拉 克 和 达 维 德 . 施 托 伊 雷 尔 等 
人 研究 者 认为 这 可 能 是 某 种 意义 上 的 最 优 算法 3， 它 引 入 了 伪 概 率 的 概念 。 伪 概率 
是 我 们 所 知道 的 概率 的 一 种 推广 ， 但 它 可 以 取 负 数值 。 这 种 放宽 得 到 的 结果 似乎 
拥有 计算 更 迅速 的 优势 ， 而 如 果 解 释 得 当 的 话 ， 这 些 结果 仍然 非常 有 用 。 

第 五 个 方法 ， 也 是 最 后 一 个 方法 ， 其 实 就 是 考虑 一 组 有 限 的 概率 法 则 ， 如 果 
不 要 求 完 全 符合 数据 的 话 ， 其 中 进行 的 运算 就 能 够 迅速 完成 。 这 种 方法 有 多 种 变 
体 ， 其 中 有 高 斯 混合 模型 ( gaussian mixture model )、 变 分 贝 叶 斯 方法 (variational 
bayesian method) 和 期 望 传播 ( expectation propagation )。 关 键 在 于 ， 拥 有 一 种 稀 
量 概率 分 布 之 间 相 似 程度 的 方法 至 关 重 要 。 这 个 任务 并 不 简单 ! 对 不 确定 性 进行 
适当 的 量化 并 不 是 一 个 直观 的 工作 。 刚 好 ， 这 就 是 下 一 章 的 主题 。 
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绝对 确信 是 未 受 教育 的 人 和 狂 信 者 的 特权 。 

对 科学 界 而 言 ， 这 是 一 种 无 法 触及 的 理想 。 
HET + ASC + EUR (1862—1947 ) 

小 成 就 可 以 用 工作 能 力 来 解释 ， 惊 人 的 成 功 


则 归 因 于 方差 。 


纳 齐 姆 . 塔 利 布 (1960— ) 


#15s 


不 走运 导致 的 错误 


FiveThirtyEight 与 2016 年 美国 总 统 大 选 


有 如 晴天 霹雳 ， 与 所 有 人 的 期 竺 相反, 在 2016 年 11 月 8 日 ,候选 人 唐纳德 . 特 


朗 普 被 选 为 美利坚 合众国 总 统 。 这 一 结果 出 人 意料 ， 因 为 所 











民意 调查 都 预言 了 


有 
特 朗 普 会 落 败 。 第 二 天 ,我 的 同事 们 纷纷 挪 痊 我 : 这 次 贝 叶 斯 模型 失效 了 。 比 如 











说 ,内 特 ， 西 尔 ; 




















及 其 FiveThirtyEight 团队 趾 认 为 ， 特 朗 普 竞选 成 功 的 机 会 只 
28.6%, MAME 克林顿 成 功 的 机 会 却 是 压倒 性 的 71.4%。 贝 叶 


斯 主义 失败 了 。 


但 也 有 可 能 并 非 如 此 。 我 打赌 ， 许 多 看 到 这 些 数 字 的 人 会 将 它们 与 选举 的 票 
数 结果 ， 也 就 是 每 位 候选 人 收 到 的 选票 所 占 的 百分比 混淆 起 来 。 但 FiveThirtyEight 
的 数字 衡量 的 并 不 是 这 个 ， 而 是 有 关 未 来 美国 总 统 会 是 谁 的 贝 叶 
我 们 回 到 两 个 小 孩 的 谜 题 。 如 果 你 不 知道 其 他 条 件 ， 那 么 打赌 两 个 小 孩 不 会 





都 是 男孩 似乎 也 很 合理 。 作 为 合格 的 贝 叶 















































斯 置信 和 度 。 





斯 主义 者 ， 你 会 回 这 种 情况 赋予 25% 的 


概率 ( 为 了 方便 ,假设 每 个 孩子 是 男孩 的 概率 都 是 二 分 之 一 )。 现 在 想象 一 下 ， 你 
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发 现 这 两 个 孩子 的 确 都 是 男孩 。 要 否定 贝 叶 斯 方法 ， 这 个 理由 真 的 充分 吗 ? 

我 甚至 要 主张 FiveThirtyEight 的 预测 并 不 代表 贝 叶 斯 方法 失效 ， 反 而 代表 
着 它 的 胜利 。 即 使 众多 专家 都 已 经 预计 希拉 里 ， 克林顿 会 被 选 为 总 统 ， 但 对 
FiveThirtyEight 结果 的 正确 解释 应 该 是 呼吁 人 们 持 有 更 大 程度 的 说 愤 。28.6% 的 概 
率 不 足以 被 忽略 ， 如 果 某 个 事件 以 这 样 的 概率 发 和 后， 那么 一 般 来 说 这 也 算 不 得 惊 
人 。 连 续 生 了 两 个 男孩 并 不 违反 概率 法 则 。 

此 外 ， 纯 粹 贝 叶 斯 主义 者 从 来 不 会 尝试 单独 判断 某 个 模型 的 有 效 性 一 一 这 只 
是 一 次 又 一 次 地 强调 “所 有 模型 都 是 错 的 "。 纯 粹 贝 叶 斯 主义 者 会 不 断 衡量 某 个 模 
型 相对 于 其 他 模型 的 有 效 性 。 然 而 在 唐纳德 特 朗 普 竞选 成 功 这 个 例子 中 ， 众 多 
模型 都 曾 高 声 、 强 势 地 宣言 了 他 不 可 避免 会 失败 。 与 这 些 拙劣 的 竞争 者 相 比 ， 无 
论 是 在 2016 年 的 美国 总 统 选举 中 还 是 在 此 前 的 总 统 选举 中 ，FiveThirtyEight If] 1 
叶 斯 模型 显然 表现 更 好 。 

你 现在 可 能 会 说 贝 叶 斯 主义 者 就 像 从 来 事 不 关 己 的 先知 ,或 是 江湖 骗子 ， 既 
说 天 会 下 两 ， 又 说 天 会 放晴 。 人 们 有 时 也 说 ， 科 学 不 会 做 出 实验 无 法 否定 的 近似 
预测 。 这 其 实 是 对 科学 史 的 误解 。 理 查 德 . 费 曼 曾经 就 这 样 说 过 :“ 人 们 追寻 确定 
性 ,但 是 确定 性 并 不 存在 。” 还 有 一 个 特别 的 领域 ,其 中 人 们 对 概率 的 核心 地 位 达 
成 了 共识 ， 那 就 是 量子 力学 。 

































































































































































量子 力学 是 概率 性 的 吗 ? 














人 们 通常 用 薛 定 刘 的 猫 来 说 明 量 子 力学 的 不 确定 性 。 在 这 个 思想 实验 中 ， 一 
只 猫 被 关 在 装 有 放射 性 原子 的 箱子 里 ， 其 中 还 有 一 个 装置 ， 当 放射 性 原子 衰变 时 
就 会 放出 毒气 。 量 子 力 学 预言 ， 只 要 箱子 保持 封闭 ， 这 只 猫 就 会 处 于 一 种 奇怪 的 
量子 登 加 态 ， 成 了 一 只 既 死 又 活 的 猫 一 一 在 数学 上 ， 这 与 一 只 要 么 存活 、 要 么 死 
亡 的 猫 完 全 不 同 。 

但 我 们 先 把 量子 力学 的 奇怪 之 处 放 到 一 边 ， 把 注意 力 集中 到 另 一 个 没 那么 奇 
怪 的 方面 。 当 我 们 打开 箱子 的 时 候 ， 猫 有 一 定 的 概率 还 活着 ， 也 有 一 定 的 概率 已 
经 死 了 。 它 变 成 了 要 么 存活 、 要 么 死亡 的 状态 。 但 更 重要 的 是 ， 我 们 不 可 能 预见 
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猫 在 被 观察 之 后 的 量子 ， 
物理 学 家 埃 尔 温 - 


自己 与 此 相关 。 fx 




















， 它 似乎 在 根本 上 就 是 随机 的 。 
醉 定 证 痛恨 这 样 的 结论 。“ 我 不 喜欢 这 个 结论 ， 而 我 很 遗憾 


F 写 道 。 他 并 不 是 唯一 一 个 这 样 想 的 人 。 爱 因 斯 坦 补充 道 : 


























CEA TS" mE 


该 怎么 做 。” 


1935 年 ， 爱 因 




















斯 . 玻 尔 对 此 的 回答 则 是 :“ 爱 因 



































斯 坦 ， 不 要 指点 上 帝 应 


斯 坦 、 波 多 尔 斯 基 和 罗 森 发 表 了 一 篇 令 人 目瞪口呆 的 文章 ， 其 





中 他 们 证 明了 量子 力学 不 可 能 是 一 个 局 域 性 的 理论 。 换 句 话 说， 他 们 证 明了 量 





子 力学 意味 着 两 个 相距 遥远 的 粒子 可 以 瞬时 互相 影响 ， 爱 因 
“幽灵 般 的 超 距 作用 ” 
违反 了 狭义 相对 论 
力学 仍 不 完整 ， 尤 其 是 ， 概 率 的 使 有 

然而 在 1982 年 ， 阿 兰 . 爱 














斯 坦 给 这 种 现象 起 了 























这 个 外 号 。 爱 因 斯 坦 否认 这 种 荡 雇 的 现象 存在 ， 因 为 它 似乎 
! 最 大 的 速度 。 由 此 ， 他 推断 量子 
应 该 纯粹 是 我 们 的 无 知 造 成 的 幻象 。 

斯 派克 特 及 其 合作 者 利用 实验 证 明了 这 种 “幽灵 般 
的 超 距 作 用 ”确实 存在 。 这 让 斯 带 芬 . 霍金 开 了 个 玩笑 :“ 上 帝 不 仅 找 角子 ,而 且 
有 时 候 还 把 山子 描 到 我 们 找 不 到 的 地 方 。” 

















的 前 提 假 设 ， 即 光速 是 宇宙 



































目前 ， 大 部 分 量子 











麦 物理 学 家 尼 尔 























概率 性 的 。 但 这 并 非 
预测 的 特性 并 非 只 是 我 们 认识 上 的 缺陷 ， 它 还 
然而 ， 人 们 对 于 这 个 诠释 仍 没 有 达成 科学 共 
































物理 学 家 赞同 所 谓 的 哥本哈根 诠释 ， 这 一 名 称 致敬 的 是 丹 
Hr: 玻 尔 。 根 据 这 种 诠释 ， 在 箱子 被 打开 的 瞬间 ， 猫 的 量子 态 是 
的 层面 上 。 这 种 诠释 指出 ， 猫 的 量子 态 不 可 
则 中 被 编码 好 的 基础 机 制 。 
外。 除 此 之 外 ， 还 存在 多 种 埠 
































代 解 释 。 其 中 之 一 就 是 休 … 埃 弗 里 特 的 多 世界 诠释 。 但 是 ， 埃 弗 利 特 提出 的 这 个 诠 











释 被 尼 尔 斯 ， 玻 尔 否定 了 。 心 灰 意 冷 的 埃 弗 利 特 离 开 了 物理 学 领域 ,将 拉 格 朗 日 
乘 数 法 的 应 用 推广 到 了 优化 问题 





























这 可 真是 个 悲伤 的 结局 。 


即使 埃 弗 利 特 的 多 世界 诠释 看 似 荒 廖 ， 对 于 波 普尔 的 信徒 尤其 如 此 ， 但 作为 
贝 叶 斯 主义 者 的 埃 利 泽 ' 尤 德 科 夫 斯 基 在 他 的 博客 Less Wrong? 上 为 其 进行 了 辩 
护 ， 他 的 依据 是 算法 版 的 奥 卡 姆 剃刀 。 即 使 埃 弗 利 特 的 多 世界 诠释 带 来 的 后 果 超 

















出 了 我 们 有 限 的 想象 ， 但 它 的 基础 具有 一 条 非常 简单 的 原则 : 如 果 宇 宙 的 唯一 法 
够 预测 量子 态 在 未 经 观察 的 情况 下 会 如 何 演化 的 方 





DEEE SOIR, il 


程 ， 那 它 会 引出 什么 结论 ? 
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对 于 那些 赞叹 物理 方程 优美 简洁 的 人 来 说 ， 埃 弗 利 特 提 出 的 这 个 诠释 有 着 种 
种 令 人 和 舒心 的 地 方 。 现 在 我 们 可 以 告别 概率 性 现象 了 ， 何 况 它 还 与 “观察 ”这 一 
星 深 模糊 的 概念 同时 发 生 (但 这 种 对 量子 态 的 观察 可 以 由 机 器 进行 ， 所 以 与 意识 
FEIKE )。 根 据 多 世界 诠释 ， 观察 的 不 确定 性 实际 上 来 自 观察 发 生 时 开始 相互 作 
用 的 物体 之 间 的 量子 纠缠 。 因 为 我 们 自 映 就 与 周围 的 事物 一 起 处 于 量子 纠缠 之 中 ， 
所 以 我 们 只 能 观察 到 那些 与 我 们 自身 纠缠 的 量子 态 一 一 有 时 候 人 们 也 说 ， 我 们 被 
困 于 薛 定 齐 方 程 在 量子 纠缠 发 生 时 创造 出 来 的 众多 宇宙 分 支 之 一 外 中 。 

这 样 的 话 ， 在 观察 时 产生 的 概率 性 并 非 宇 宙 法 则 中 国有 的 现象 ， 而 是 认识 论 
上 的 不 确定 性 ， 因 为 我 们 只 能 归属 于 量子 多 重 宇宙 的 唯一 一 个 分 文 。 当 然 ， 多 世 
界 诠 释 带 来 的 结论 实在 不 可 思议 。 但 对 于 合格 的 贝 叶 斯 主义 者 来 说 ， 在 衡量 理论 
的 置信 和 度 时 ， 那 些 不 可 观察 的 结果 无 关 紧 要 。 重 要 的 是 思想 实验 项 ， 也 就 是 理论 
解释 观察 数据 的 能 力 ， 还 有 所 罗 门 诺 夫 通过 理论 的 最 短 算法 描述 的 长 度 来 衡量 的 
先 验 置信 度 。 多 世界 诠释 在 预测 方面 等 价 于 其 他 所 有 诠释 。 然 而 ， 因 为 多 世界 诠 
释 拥 有 明显 更 短 的 算法 描述 ， 所 以 它 似乎 应 该 能 在 贝 叶 斯 主义 考 那 里 得 到 更 高 的 
置信 和 度 。 

但 对 我 来 说 ， 尤 德 科 夫 斯 基 的 这 个 论证 似乎 应 该 打 个 折扣 ， 尤 其 是 如 果 我 们 
相信 第 7 章 中 所 讲 的 所 罗 门 诺 夫 体系 的 话 。 这 是 因为 ， 为 了 进行 预测 ， 我 们 似乎 
必须 将 薛 定 刘 方 程 与 多 重 宇宙 复杂 物理 状态 的 描述 结合 起 来 。 如 此 一 来 ， 由 于 量 
子 分 支 之 间 可 能 产生 干涉 ， 我 们 似乎 需要 其 他 量子 宇宙 的 描述 才能 做 出 预测 。 然 
而 ， 这 样 的 描述 似乎 极其 耗费 储存 空间 。 这 就 是 多 世界 诠释 的 先 验 置 信和 度 会 下 降 
的 原因 。 

我 不 是 这 些 问题 的 专家 ， 而 且 我 对 自己 这 个 论证 的 置信 和 度 也 很 有 限 ， 所 以 我 
更 乐意 承认 我 在 这 个 问题 上 的 无 知 。 此 外 ， 人 们 还 提出 了 另外 几 个 量子 力学 的 
诠释 ， 比 如 拥有 确定 性 但 没有 定 域 性 的 德 布 罗 意 — 玻 姆 理论 名、 量子 贝 叶 斯 主义 
( quantum Bayesianism )， 还 有 英语 版 维基 百科 页 面 中 列 出 的 十 几 种 其 他 诠释 中。 

无 论 喜 欢 哪 种 量子 力学 诠释 ， 我 们 都 必然 会 注意 到 概率 论 在 量子 力学 中 扮演 
着 关键 的 角色 。 在 预测 欧洲 核子 研究 中 心 的 大 型 强 子 对 撞 机 中 两 个 质子 碰撞 会 
生 什么 结果 时 ， 时 至 今日 最 好 的 描述 仍然 是 对 可 能 出 现 的 各 种 结果 分 配 不 同 的 概 
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率 ， 就 像 内 特 ' 西 尔 弗 预测 选举 结果 时 所 做 的 那样 。 量 子 力学 即使 在 预测 结果 并 
不 明确 的 情况 下 仍然 如 此 成 功 ， 那 是 因为 它 向 不 同 结果 分 配 的 概率 与 实际 观察 到 
DCR RAT | 














混沌 理论 





不 可 避免 需要 使 用 概率 的 情况 似乎 远 远 不 止 量子 力学 和 内 特 ' 西 尔 弗 进 行 的 
选举 预测 。 特 别 是 在 混沌 现象 被 发 现 之 后 ， 数 学 家 最 终 确信 ， 这 在 许多 情况 中 就 
是 最 好 的 结果 了 。 气 象 预报 就 是 其 中 一 种 典型 的 情况 。 虽 然 我 们 已 经 相当 了 解 描 
述 气象 的 方程 了 ， 而 且 地 表 和 轨道 上 各 种 各 样 的 传感器 也 越 来 越 多 ， 但 长 期 气象 
预报 仍然 非常 不 可 靠 。 数 学 家 爱德华 . 洛 伦 效 在 20 世纪 60 年 代 就 预测 到 了 气象 
预报 的 这 种 无 法 避免 的 不 确定 性 ， 他 也 在 彼 时 奠定 了 我 们 今天 所 说 的 混沌 理论 的 
基础 。 

混沌 理论 观察 到 如 下 的 事实 : 某 些 简 单 的 动力 系统 对 于 初始 状态 的 细微 变动 
极为 敏感 。 与 单 摆 不 同 ， 双 摆 完 美 地 曾 释 了 这 种 现象 。 伽 利 略 惊讶 地 注意 到 单 摆 
有 着 难以 置信 的 规律 性 ， 它 的 摆动 频率 与 振幅 几乎 独立 ， 但 双 摆 完全 不 一 样 。 我 
有 笠 被 视频 主播 Dr Nozman 邀请 ,一 同 探究 双 摆 那 惊人 的 不 可 预测 性 中 。 

这 个 装置 简约 得 难以 置信 : 单 摆 下 面 连接 着 另 一 个 单 摆 ”。 将 双 摆 中 的 下 摆 拉 到 
竖 直 方向 上 不 稳定 的 点 ， 也 就 是 平衡 点 的 正 上 方 ， 然 后 松手 。 如 果 双 摆 足 够 润滑 
的 话 ， 你 就 可 以 确定 它 所 划 过 的 轨迹 在 宇宙 历史 上 是 独一无二 的 。 即 使 你 想 重复 
这 一 轨迹 ， 也 没有 办 法 完美 重 现 ， 甚 至 不 可 能 得 到 与 之 仅仅 部 分 相似 的 轨迹 。 这 
是 因为 ， 初 始 状态 中 极其 微小 的 变动 经 过 几 次 振荡 之 后 就 会 完全 打 乱 双 摆 的 轨迹 。 

自从 洛 伦 效 的 发 现 以 来 ， 数 学 家 同样 发 现 混沌 并 非 例 外 ， 甚 至 似乎 是 常态 。 
现实 世界 充满 混沌 ， 难 以 察觉 的 微小 涨 落 在 不 久之 后 也 可 能 导致 可 观 的 后 果 。 这 
就 是 人 们 通常 所 说 的 蝴蝶 效应 ， 它 以 肯定 的 方式 回答 了 菲利普 梅里 利 的 这 个 明 
知 故 问 的 问题 : “巴西 的 一 只 蝴蝶 肩 动 了 翅膀 ， 这 会 导致 美国 得 克 萨 斯 州 发 生 一 场 


































































































中 ”两 个 单 押 都 用 硬 质 棒 连 接 ， 而 非 一 般 单 摆 使 用 的 绳子 。 译 者 注 
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龙卷风 吗 ?” 当 然 ， 这 不 是 说 蝴蝶 就 是 龙卷风 唯一 的 罪魁 祸首 。 这 个 问题 的 意思 
是 ,没有 任何 中 期 气象 预报 能 做 到 完全 可 靠 ， 除非 地 球 上 所 有 蝴蝶 的 所 有 动作 都 
已 得 到 了 测量 外。 

但 不 可 预测 性 并 不 是 状态 可 能 非常 复杂 的 系统 才 会 拥有 的 性 质 。 




















无 法 预测 的 确定 性 自动 机 














为 了 研究 简单 动力 系统 中 复杂 度 如 何 出 现 ， 数 学 家 和 计算 机 科学 家 都 将 目光 
转向 了 自动 机 。 自 动机 就 是 一 个 虚拟 宇宙 ， 它 的 物理 状态 随 着 离散 的 时 间 而 演化 。 
在 每 一 个 时 间 点 ， 新 的 物理 状态 都 可 以 根据 前 一 个 状态 计算 出 来 ， 所 用 的 规则 通 
常 非常 简单 。 

自动 机 有 许多 令 人 叹为观止 的 经 典 例子 ， 其 中 之 一 就 是 沃 尔 弗 拉 姆 自动 机 
( Wolfram automata )， 它 组 成 了 一 个 无 限 的 一 维 宇宙 ， 由 众多 紧 挨 着 的 格子 构成 。 
这 些 格子 可 以 处 于 开 或 关 的 状态 。 在 初始 时 刻 ， 只 有 一 个 格子 是 开 着 的 。 在 每 一 
个 时 间 点 ， 每 个 格子 都 会 根据 相 邻 格子 的 状态 以 及 与 它们 交互 的 规则 来 决定 自己 
应 该 开 还 是 关 。 令 人 惊异 的 是 ， 沃 尔 弗 拉 姆 的 模拟 说 明 ， 即 使 是 非常 简单 的 规则 
也 能 导致 无 法 预计 的 现象 。 沃 尔 弗 拉 姆 的 “规则 30” 正 是 这 种 情况 ， 它 会 画 出 难 
以 预料 的 分 形 图 案 。 

更 妙 的 是 ， 数 学 家 约翰 康 威 提出 了 二 维 自动 机 的 一 组 非常 简单 的 规则 ， 名 
为 生命 游戏 。 这 里 的 舞台 的 还 是 一 组 格子 ， 但 这 次 它们 排列 成 了 无 限 的 网 格 ， 而 
且 每 个 格子 会 根据 相 邻 格子 的 状态 以 及 非常 简单 的 规则 来 决定 自己 的 状态 是 开 还 
是 关 鸟 。 即 使 如 此 ， 这 些 简 单 的 规则 已 经 被 证 明 是 图 灵 完 全 的 ， 也 就 是 说 ， 任 何 
机 器 可 执行 的 计算 都 可 以 用 康 威 的 生命 游戏 来 模拟 。 因 此 ， 如 果 我 们 承认 丘 奇 - 
图 灵 论 题 的 话 ， 那 么 整个 宇宙 都 只 是 一 组 计算 ， 能够 通过 生命 游戏 在 巨大 的 网 格 
上 被 完全 模拟 ( 但 网 格 大 得 可 怕 ， 至 少 是 古 戈 尔 的 量 级 ， 也 就 是 1010) 

人 们 深入 研究 过 的 自动 机 的 最 后 一 个 例子 就 是 兰 顿 蚂蚁 ( Langton's ant), 一 
只 蚂蚁 被 放 在 网 格 上 ， 其 中 每 个 方 格 都 处 于 或 开 或 关 的 状态 。 如 果 方 格 处 于 “ 关 ” 
的 状态 ,那么 蚂蚁 就 会 先 向 右 转 ， 然 后 前 进 一 格 ; AU, MURS AR, SE 
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前 进 一 格 。 无 论 如 何 ， 在 离开 格子 的 时 候 ， 蚂 蚁 会 将 格子 的 状态 反 转 ， 如 果 之 前 
格子 处 于 “ 开 ” 的 状态 ， 那 么 此 时 就 会 变 成 “ 关 ”， 反 之 亦 然 。 现 在 将 蚂蚁 放 到 所 
有 方 格 都 处 于 “ 关 ” 的 状态 的 网 格 上 ， 头 部 向 上 ， 然 后 开始 运行 自动 机 。 不 出 意 
TL, Pid 500 步 相 对 来 说 都 相当 对 称 ， 而 且 具 有 一 定 结构 。 然 而 ， 这 种 表面 
上 的 对 称 性 在 几 千 步 之 后 似乎 就 被 完全 拱 毁 了 。 昌 蚁 的 运动 看 似 变 得 随机 。 

但 这 还 不 是 最 奇怪 的 事情 。 在 10 000 步 之 后 ， 蚂 蚁 突然 开始 沿 着 一 条 规则 并 
且 儿 乎 周期 性 的 路 径 行动 ， 它 沿 着 左上 方 对 角 线 的 方向 不 断 远离 ， 直 到 无 限 。 这 
一 路 径 被 称 为 兰 顿 蚂 习 的 高 速 公 路 。 令 人 惊异 的 是 ， 确 定 什么 初始 状态 会 得 出 高 
速 公 路 仍然 是 一 个 悬而未决 的 问题 91。 

这 些 自动 机 展示 了 ， 简 单 的 规则 如 何 轻易 得 出 似乎 不 可 预料 的 现象 。 然 而 ， 
对 于 纯粹 贝 叶 斯 主义 者 来 说 ， 这 些 规 则 实际 上 并 没有 什么 无 法 预计 的 地 方 ， 只 需 
进行 模拟 计算 就 能 确定 一 切 。 但 对 于 凡人 来 说 ， 兰 顿 蚂 尽 高 速 公 路 这 样 的 现象 在 
实践 中 的 确 非常 难以 预测 ， 原 因 之 一 就 是 似乎 需要 大 量 计算 才能 预测 出 这 些 现 象 。 
人 们 也 把 这 类 现象 称 为 涌现 。 




























































































热力 学 


兰 顿 蚂 尽 的 高 速 公 路 似乎 来 自 支 配 蚂 疏 运 动 的 基本 法 则 。 同 样 ， 在 某 些 温度 
和 和 气压 的 条 件 下 ， 流 体力 学 方程 似乎 也 会 从 分 子 间 相 互 作 用 的 基本 法 则 之 中 涌现 
出 来 。1872 年 ， 路 德 维 希 : 玻 尔 效 曼 也 以 同样 的 方式 根据 原子 假设 推导 出 了 热力 
学 第 二 定律 。 由 此 ， 玻 尔 兹 曼 证 明了 时 间 不 可 逆转 其 实 是 一 项 涌现 性 质 ， 但 我 们 
在 这 里 就 不 多 讨论 了 。 

玻 尔 效 曼 的 绝妙 想法 之 一 就 是 首先 将 原子 假设 与 箭 的 概念 联系 起 来 。 要 理解 
这 个 联系 ,我 们 必须 先 从 一 个 显而易见 的 事实 出 发 : 热 水 和 凉水 混在 一 起 就 会 变 
成 温水 ， 但 反 过 来 就 不 行 。 倒 上 一 杯 温 水 ， 杯 子 中 的 水 不 可 能 左边 沸腾 ， 右 边 结 
冰 。 也 就 是 说 ， 能 量 倾向 于 变 得 均 质 化 ， 而 不 是 集中 于 一 点 。 

这 一 观察 结果 看 似 显然 ,但 只 有 物理 学 家 和 鲁 道夫 ' 克 劳 修 斯 这 样 的 天 才 才 敢 
认真 考虑 这 个 问题 。 通 过 引入 名 为 箭 的 物理 量 ， 克 劳 修 斯 成 功 将 这 一 原则 转化 为 
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数学 公式 。 热 水 和 凉水 混合 起 来 会 得 到 温水 ,其实 就 是 说 封闭 系统 的 烂 会 上 升 。 
克 劳 修 斯 将 后 者 提升 到 了 “热力 学 第 二 定律 ”这 个 高 度 00, 
然而 克 劳 修 斯 的 箭 仍然 相当 隐 汐 ， 没 有 被 人 理解 。 玻 尔 效 曼 的 天 才 之 处 在 于 
通过 原子 假设 来 定义 箭 ， 也 由 此 砌 下 了 统计 力学 的 第 一 块 砖 。 玻 尔 效 曼 为 他 的 定 
义 感到 非常 自豪 ， 其 至 将 它 写 在 了 自己 的 墓碑 上 面 : $=k InW。 这 个 方程 说 的 是 什 
么 ”首先 要 明白 ,我 们 有 关 热 力学 的 测量 仪 絮 无 法 测量 围绕 着 我 们 的 10% 个 粒子 
的 位 置 和 速度 ， 毕 竟 要 做 到 这 一 点 可 需要 千 亿 亿 亿 字 节 。 与 之 相反 ， 我 们 测量 的 
热力 学 物理 量 ， 比 如 压力 、 温 度 、 容 积 或 质量 ， 都 概括 了 大 量 粒 子 的 行为 。 我 们 
说 这 些 量 是 宏观 量 ， 与 之 相对 的 是 直接 来 自 粒 子 的 微观 量 。 
尔 效 受 的 智 态 就 在 于 注意 到 在 宏观 量 已 知 的 前 提 下 ， 焙 正好 能 够 量化 微观 
上 的 不 确定 性 。 更 准确 地 说 ， 玻 尔 兹 曼 证 明了 克 劳 修 斯 研究 的 炉 5 实际 上 相当 于 
与 宏观 量 相 符合 的 微观 状态 个 数 下 的 对 数 ， 两 者 之 间 只 差 了 一 个 乘法 常数 k， 我 
们 把 它 叫 作 玻 尔 兹 曼 常数 。 克 劳 修 斯 预言 粹 这 个 物理 量 的 增加 不 可 避免 ,但 它 不 
过 是 一 种 在 完成 宏观 测量 之 后 对 依旧 存在 的 微观 不 确定 性 的 量化 。 
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LA PET REA ERRAN, ARTE, (EE, RARE ME M ATE 
人 类 历史 上 肩负 着 重任 : 破译 纳粹 密码 。 在 第 二 次 世界 大 战 期 间 ， 英 国人 艾 伦 ' 图 
灵 和 美国 人 克 劳 德 ， 香农 兽 经 为 了 交换 密码 学 知识 碰 过 面 。 香 农 和 网 灵 当 时 似乎 
并 没有 怎么 讨论 密码 学 ,但 两 人 都 理解 了 对 不 确定 性 进行 量化 的 重要 性 。 为 此 ， 
图 灵 在 战争 期 间 引 入 了 班 伯 里 的 计算 ,用 以 推断 数 段 不 同 密 文通 过 同一 个 恩 尼 格 
玛 密码 机 配置 加 密 得 到 的 可 能 性 的 置信 和 度 0。 香 农 在 这 条 道路 上 走 得 更 远 。 

在 1948 年 ,香农 发 表 了 人 类 历史 上 最 具 影 响 力 的 论文 之 一 ， 题 为 《通信 的 数 
学 原理 》(“A Mathematical Theory of Communication”)。 这 篇 卓越 的 论文 提出 ， 可 
以 利用 概率 分 布 来 为 某 个 信 源 发 送 的 消息 建 模 。 用 贝 叶 斯 的 术语 来 说 ， 这 就 相当 
于 考虑 这 个 信 源 之 后 会 发 送 的 消息 的 先 验 概率 分 布 。 比 如 说 ， 纳 粹 士兵 很 有 可 能 
在 发 送 的 消息 中 某 处 插入 “和 希特勒 万 岁 ”， 使 用 德语 词汇 ， 或 者 只 发 送 “一 切 如 
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常 ”的 德语 翻译 。 纳 粹 发 送 的 消息 是 随机 的 ， 但 远 非 任意 的 。 

香农 的 第 一 个 天 才 之 举 ， 就 是 将 消息 中 的 信息 量 等 同 于 在 贝 叶 斯 置信 和 度 的 视 
角 下 这 一 消息 的 稀有 性 。 比 如 说 “Lé” 这 个 名 字 在 欧洲 就 包含 了 许多 信息 ， 几 平 
可 以 等 同 于 我 。 这 是 因为 这 个 名 字 在 欧洲 非常 罕见 ， 正 是 这 种 稀有 性 让 它 能 够 传 
递 大 量 信息 。 

反之 ， 同 一 个 名 字 在 越南 河内 就 几乎 不 包含 任何 信息 ， 它 能 指向 叫 这 个 名 字 
的 几 千 其 至 数 十 万 越南 人 。 这 个 词 如 此 常见 的 事实 意味 着 它 带 有 的 信息 量 很 少 。 
也 就 是 说 ， 一 条 消息 中 包含 的 信息 只 能 相对 于 某 个 情景 来 衡量 ， 更 准确 地 说 ， 是 
相对 于 某 个 用 于 评判 信息 出 现 概率 的 贝 叶 斯 置信 度 体系 而 言 。 没 有 语 境 和 质疑 ， 
概率 检验 就 出 问题 。 

香农 的 第 二 个 天 才 之 举 ， 就 是 利用 对 数 来 量化 消息 中 的 信息 量 。 为 什么 是 对 
数 ? 那 是 因为 两 条 独立 消息 的 信息 量 就 是 每 条 消息 的 信息 量 之 和 ， 但 两 条 独立 信 
息 同 时 出 现 的 概率 是 两 者 概率 的 乘积 。 要 将 乘积 变 成 求 和 ， 我 们 必须 用 到 相关 的 
数学 工具 。 我 们 在 第 11 章 看 到 ， 这 一 工具 就 是 对 数 。 

更 准确 地 说 ， 对 于 出 现 概率 为 p(m) 的 信息 m， 香 农 将 其 信息 量 定义 为 
h(m)=1logs(1/p(m))。 也 就 是 说 ， 这 样 的 信息 含有 的 信息 量 就 是 令 pon) =1/2 的 指 
数 hm)。 所 以 ,出现 概率 非常 小 的 信息 拥有 的 信息 量 An) 很 大 。 最 后 ， 香 农 推断 出 
了 信 源 的 期 望 信息 量 五 的 公式 ， 也 就 是 这 个 信 源 发 出 的 消息 的 平均 信息 量 A(m) : 


H-E,| h(m)] = 2 p(m)los; (1/ p(m)) 


香农 希望 将 且 这 个 数量 称 为 信 源 的 期 望 信息 量 或 不 确定 性 函数 。 但 最 终 他 听 
ATAR D - presens. NA EU ER, MAMA 98—. PR 
的 这 个 不 确定 性 函数 在 统计 物理 学 中 也 会 用 到 ， 用 的 就 是 这 个 名 字 ， 所 以 ， 它 已 
经 有 名 字 了 。 第 二 ， 更 重要 的 是 ,没有 人 真正 知道 炉 是 什么 ， 所 以 在 你 任何 论 准 
里 都 可 以 先发制人 。” 

但 香农 的 烂 是 不 是 真 的 与 玻 尔 兹 曼 的 炉 一 样 ? 答案 是 肯定 的 ， 实 际 上 ， 前 者 
是 后 者 的 推广 。 为 了 理解 这 一 点 ,我 们 必须 意识 到 ， 在 给 定 宏观 量 测量 值 的 前 
提 下 ， 对 于 可 能 出 现 的 不 同 微观 状态 ， 我 们 都 拥有 它 的 先 验 置信 和 度 。 但 玻 尔 效 
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曼 证 明了 ， 在 热力 学 平衡 中 与 宏观 量 相 容 的 所 有 丈 个 微观 状态 出 现 的 可 能 性 都 相 
等 。 因 此 ， 每 个 微观 状态 出 现 的 概率 都 是 VW. 将 香农 方程 中 的 pon) 换 成 VW É9 
话 ， 我 们 就 能 得 出 在 下 个 微观 状态 等 可 能 出 现 的 情况 下 ， 热 力学 系统 的 炉 就 
是 五 =log,(W)。 如 果 要 使 这 些 量 的 单位 符合 物理 量 的 国际 单位 制 的 话 ， 就 必须 乘 
以 一 个 常数 。 

香农 确 确实 实 推广 了 玻 尔 兹 曼 的 炉 。 
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香农 的 最 优 压缩 











香农 的 第 三 个 天 才 之 举 ， 就 是 理解 了 烂 实际 上 衡量 的 是 什么 。 看 上 去 要 多 奇 
怪 有 多 奇怪 的 是 ， 炉 衡量 的 实际 上 是 消息 的 最 优 压缩 。 也 就 是 说 ， 它 衡量 的 是 将 
消息 储存 在 硬盘 上 需要 的 最 少 比 特 数 ， 或 者 说 通过 带宽 有 限 的 电缆 传输 这 一 消息 
所 需 的 最 短 时 间 。 香 农 实际 上 证 明了 我 们 无 论 如 何 都 无 法 超越 通过 香农 烂 计算 出 
来 的 根本 限制 。 

为 了 理解 香农 闹 和 数据 压缩 之 间 的 关系 ， 我 们 考虑 一 下 “ 猜 猜 是 谁 ?” 这 个 提 
上 游戏 。 在 这 个 游戏 中 ， 每 位 玩家 先 在 一 组 人 物 头 像 中 选择 一 个 ， 然 后 猜测 对 方 
选择 的 是 哪 一 个 头像 。 为 此 ， 玩 家 必须 对 另 一 位 玩家 提出 如 下 形式 的 判断 题 : 那 
个 头像 是 男人 吗 ?” 那个 人 戴 眼 镜 吗 ? 那个 人 头发 长 吗 ? 玩家 之 间 交 替 提 问 和 回答 ， 
首先 猜 到 对 方 选 择 的 头像 的 人 就 胜出 。 

香农 在 1948 年 的 论文 中 证 明了 ， 如 果 一 共有 nn 个 头像 可 以 选择 ， 而 且 对 手 以 
随机 等 概率 的 方式 选择 了 其 中 一 个 ， 那 么 平均 来 说 必须 至 少 问 出 Tog; 1) 道 判断 题 
才能 确定 对 手 选择 的 头像 。 此 外 ,假设 我 们 知道 对 手 更 经 常 选择 男性 头像 而 不 是 
女性 头像 ， 而 且 更 偏向 于 选择 戴 眼镜 的 头像 ， 也 就 是 说 ， 如 果 我 们 对 于 对 手 的 选 
择 持 有 某 种 有 根据 的 贝 叶 斯 信念 的 话 ， 那 么 香农 的 论文 就 证 明了 平均 所 需 的 问题 
数目 至 少 等 于 对 应 的 香农 粹 。 

更 厉害 的 是 ， 香 农 炉 对 应 着 一 种 理想 状态 ， 其 中 对 手 给 出 的 答案 序列 决定 了 
他 对 头像 选择 的 最 优 编码 。 更 准确 地 说 ， 香 农 提出 的 编码 方法 相当 于 给 头像 贴 上 
由 一 串 0 和 1 组 成 的 标签 ，0 代表 否定 回答 ，1 代表 肯定 回答 。 这 样 一 来 ， 如 果 对 
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手 对 前 两 个 问题 的 回答 分 别 为 “是 ”和 “和 否 ” 的 话 ， 那 么 最 优 编码 的 开头 首先 是 
1， 接 下 来 是 0。 于 是 ， 头 像 的 身份 就 可 以 用 一 串 0 和 1 来 代表 ， 香 农 将 其 称 为 二 
进 制 数字 (binary digit )， 或 简称 为 比特 (bit) "4, 

香农 在 更 普遍 的 情况 下 证 明了 所 有 通信 都 可 以 归结 为 一 串 由 0 和 1 组 成 的 序 
列 ， 因 此 通信 和 能够 通过 数字 化 获 益 良 多 。 这 个 结论 可 能 今天 看 起 来 很 显然 , 但 当 
时 并 非 如 此 ， 很 多 人 仍然 在 模拟 技术 上 押 注 。 通 过 1948 年 的 这 篇 论文 ， 香农 开 启 
了 数字 时 代 。 






































香农 的 第 四 个 天 才 之 举 ， 就 是 证 明了 如 何 通过 不 完美 的 信道 通信 。 在 实践 中 ， 
当 人 们 用 电信 号 将 消息 从 A 传递 到 B 时 ， 这 一 信号 可 能 会 轻易 受到 各 种 干扰 。1 也 
许 会 变 成 0， 反 之 亦 然 。 为 了 处 理 这 个 问题 ， 香 农 的 想法 就 是 引入 贝 叶 斯 置信 度 ， 
用 以 推断 消息 可 能 受到 的 干扰 。 然 后 香农 证 明了 ， 只 要 这 些 贝 叶 斯 置信 和 度 是 正确 的 ， 
那么 这 个 非 完 美 信道 就 等 价 于 男 一 个 完美 信道 ， 而 这 个 完美 信道 的 带宽 等 于 非 完 美 
信道 的 带宽 减 去 信道 不 完美 性 在 某 种 意义 上 的 烂 。 因 此 ， 只 要 加 上 足够 多 的 元 余 ， 
任何 信息 都 可 以 通过 非 完 美 信道 传递 。 香 农 甚 至 对 所 需 宛 余 进行 了 量化 : 消息 在 通 
过 非 完 美 信道 传递 时 ， 所 需 宛 余 量 应 该 大 约 等 于 消息 受到 的 干扰 的 箭 中 。 

这 些 结论 可 能 非常 难以 理解 ， 但 元 余 是 一 个 我 们 非常 熟悉 的 现象 ， 虽 然 人 们 
一 直 都 没有 意识 到 这 一 点 。 当 你 跟 朋友 在 吵 闪 的 酒吧 里 讨论 的 时 候 ， 你 们 几乎 不 
可 能 听 到 对 方 所 说 的 全 部 内 容 。 虽 然 如 此 ， 一 般 来 说 ， 我 们 也 不 需要 听 到 对 方 
所 说 的 全 部 内 容 才 能 理解 对 方 在 说 什么 。 这 是 因为 ， 日 常 语言 中 的 大 部 分 词语 对 
于 句子 含义 的 影响 是 次 要 的 。 即 使 把 那些 次 要 的 句子 成 分 去 掉 ,“ 你 轻松 猜 我 话 ” 
(你 也 能 轻松 猜 到 我 想 说 的 话 )。 

法 语 拥 有 非常 多 的 元 余 ， 这 也 就 解释 了 为 什么 英语 文章 通常 比 其 法 语 译文 更 
短 ， 也 解释 了 为 什么 法 国人 说 话 比 英 国人 快 。 传 递 信息 的 带宽 实际 上 差不多 ， 因 
为 即使 法 国人 每 秒 说 出 的 音节 数 比 英 国人 更 多 ,但 比 起 英语 ， 法 语 中 每 个 音节 包 
含 更 多 的 元 余 ， 也 就 是 包含 更 少 的 信息 。 
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在 今天 ， 香 农 的 所 有 概念 ， 无 论 是 比特 、 香 农 烂 、 信 道 容 量 还 是 抑 余 量 ， 都 
已 经 成 了 信息 技术 的 核心 工具 。 但 它们 的 应 用 远 远 超越 了 技术 的 领域 。 当 然 ， 我 
门 不 仅 会 在 统计 物理 中 遇 到 这 些 概念 ， 它 们 被 用 于 研究 气体 的 状态 演变 ; 而 且 我 
门 还 会 在 语言 学 中 看 到 ， 它 们 也 被 用 于 理解 语言 的 演化 ， 其 至 在 (地 外 ) 生物 学 
中 被 用 于 探测 智慧 生命 ， 因 为 它们 的 通信 中 包含 的 元 余 可 能 与 成 年 人 类 或 海豚 的 
交流 中 的 元 余 类 似 。 一 般 正 是 语言 的 这 种 元 余 性 让 我 们 能 够 补充 别人 的 语句 。 地 
外 生命 所 说 的 句子 很 可 能 也 是 如 此 ， 因 为 这 些 智慧 生命 大 概 也 要 想 办 法 通过 
美的 信道 来 交流 "9。 
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但 这 还 不 是 结束 ! 香农 这 些 概念 的 应 用 之 一 就 是 最 终 提出 的 一 种 方法 ， 
能 够 衡量 类 似 FiveThirtyEight 做 出 的 那些 概率 性 预测 的 有 效 性 。 回 忆 一 下 ， 
FiveThirtyEight 认为 特 朗 普 启 得 选举 的 概率 是 28.6%。 如 果 用 香农 的 方式 将 这 
个 概率 编码 的 话 ， 就 需要 log,(1/0.286) = 1.8 比特 。 我 们 在 这 里 可 以 认为 这 就 是 
FiveThirtyEight 的 预测 模型 的 罚 分 。 在 一 般 情况 下 ， 我 们 可 以 这 样 计算 概率 预测 
模型 的 罚 分 : 对 于 所 有 已 发 生 的 事件 m， 如 果 模 型 预测 事件 m. 发 生 的 概率 是 p(m)， 
那么 将 所 有 可 能 的 log,(1/p(m)) 加 起 来 即 可 。 

为 什么 利用 香农 的 方法 来 衡量 概率 性 预测 的 效果 是 个 好 想法 ? 这 是 因为 香农 
证 明了 ， 如 果 世 界 的 确 是 概率 性 的 ， 而 且 符合 某 个 概率 分 布 9 的 话 ， 那 么 能 够 使 
罚 分 最 小 化 的 预测 性 模型 就 是 预测 的 概率 分 布 p 等 于 gq。 也 就 是 说 ,根据 这 种 对 不 
确定 性 的 量化 方法 ， 对 不 确定 性 的 预测 不 会 带 来 损害 。 因 此 ， 当 不 确定 性 的 确 存 
在 的 时 候 ， 比 如 说 在 混沌 系统 的 情况 中 ， 最 好 的 预测 必定 是 某 种 概率 性 预测 ， 也 
就 是 贝 叶 斯 主义 者 会 做 出 的 那 种 预测 。 

所 以 , 已 知 概率 性 预测 g 可 以 使 罚 分 最 小 ， 我 们 就 可 以 判断 预测 p 相对 于 最 
优 预测 q 的 表现 。 为 此 ， 我 们 可 以 计算 罚 分 差距 的 期 望 值 : 



























































1 q(m) 
Dyg(q|p)- IE Ls log; 一 一 -2«( qim )log, 一 一 
局 p(m) 
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莱 布 勒 引 入 的 这 个 量 今天 被 称 为 


KL BOE (虽然 物理 学 家 更 喜欢 用 自然 对 数 来 计算 这 个 量 )。 它 计算 的 是 预测 p JH 
对 于 最 优 预 测 q 的 误差 ， 这 个 值 总 是 大 于 等 于 0。 所 以 它 衡量 的 是 预测 p 偏离 最 优 


预测 的 程度 。 


KL 散 度 在 方方面面 都 可 以 说 
毕竟 朴素 的 直 
率 不 超过 一 半 ， 而 否定 FiveThirtyEight 的 预测 。 





朴素 直觉 要 好 ， 








仅 从 中 抽出 确定 的 预测 ; 
[BIS 





因此 ， 我 们 经 常 











何 理 
DU 
分 那些 








I 向 它 赋予 的 置信 度 
5 因 不 了 解 问题 











因 知 道 问题 有 着 根本 性 困难 和 大 量 不 胡 





就 应 该 比 其 人 





是 量化 概率 性 预测 准确 性 的 好 方法 ， 


或 者 至 少 比 








觉 会 
































仅仅 因为 实际 发 生 的 事件 在 预测 中 被 赋予 的 概 
我 们 往往 过 度 简化 概率 模型 ， 仅 
我 们 往往 希望 确定 谁 对 谁 错 ， 却 忽略 不 
E 往 忽视 概率 模型 和 贝 叶 斯 主义 要 求 我 们 做 到 的 那 种 谨慎 。 
指责 那些 做 出 含糊 预测 的 人 但 求 无 过 ， 但 这 样 的 预测 没有 任 
由 使 KL 散 度 取 最 小 值 。 如 果 有 一 种 情况 比 其 他 情况 都 更 可 能 发 生 ， 那 么 最 
也 情况 更 大 。 也 就 是 说 ， 
( 即使 其 中 没 多 少 不 确 定性 ) 而 立场 不 确定 的 预测 ， 








不 倚 的 意见 ; 我 














KL 散 度 让 我 们 能 区 
与 那些 
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定 的 预测 。 














不 笠 的 是 ,在 实践 中 ，KL 散 度 很 少 被 用 来 判断 预测 的 有 将 性 。 一 般 来 说 ， 





为 获得 奖励 的 (无论 是 金 
这 就 不 可 避免 地 推 
少 衡量 不 确定 性 的 合 














钱 还 是 社会 ] 








地 位 ) SEARCH TIER 
动人 们 进行 确定 性 的 预测 ， 
适 方法 会 将 我 们 推 


而 将 应 有 的 谨慎 抛 诸 脑 后 。 
向 过 度 诠释 ， 掉 进 地 存 者 偏差 的 陷阱 








的 确定 性 预测 的 
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对 于 那些 意见 并 非 黑白 分 明 的 专家 ， 没 有 人 愿意 将 话 简 递 向 他 们 ， 他 们 的 看 法 不 





会 在 黄金 时 段 播 出 ， 


也 不 会 在 社交 网 络 中 被 大 鸭 





转发 。 


更 可 怕 的 是 ， 可 能 正 是 因为 我 们 倾向 于 先 回忆 起 胜利 而 不 是 失败 ， 所 以 我 们 


一 直 对 自己 太 有 信心 了 ， 





的 方法 ， 对 于 克服 自信 过 度 来 说 似乎 是 必 不 可 少 的 第 一 步 ， 应 用 贝 叶 





经 常 处 于 自信 过 度 的 状态 。 


判断 自信 程度 是 否 恰当 的 理想 途径 。 


沃 瑟 斯 坦 度量 





然而 ，KL 散 度 并 不 是 概率 性 预测 表现 唯一 可 色 





改变 判断 自身 预测 是 否 有 效 
斯 公式 则 是 

















BE 的 度量 。 实 际 上 这 样 的 度量 众 
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多 中， 然而 与 KL 散 度 相 反 ， 许 多 度量 都 不 适合 用 算法 搜寻 适当 的 预测 po 

然而 ， 还 有 另 一 种 衡量 两 个 概率 分 布 P 和 9 的 方法 ， 这 种 方法 同样 适合 算法 
计算 ， 那 就 是 沃 瑟 斯 坦 度 量 (Wasserstein metric )， 也 被 称 为 炮 手 距 离 ， 或 运输 问 
题 最 优 解 。 这 一 度量 的 优势 在 于 ， 它 考虑 了 某 个 事件 m 与 另 一 个 事件 m AAE 
度 的 差异 ， 而 KL 散 度 却 没 有 考虑 这 一 点 。 这 样 的 话 ， 如 果 你 预测 某 块 斑点 是 黄 
色 的 ， 而 我 预测 它 是 蓝 色 的 ， 但 最 终结 果 是 橙黄 色 的 话 ， 那么 KL 散 度 会 说 我 们 
两 个 人 都 摘 错 了 ， 然 而 你 的 预测 比 我 的 预测 更 接近 正确 答案 。 沃 瑟 斯 坦 度量 能 让 
我 们 准确 表达 “你 比 我 更 正确 ”的 直觉 。 

我 们 详细 探讨 一 下 。 假 设 你 必须 预测 明年 仓库 的 地 板 上 什么 地 方 会 突然 出 现 
咖啡 涡 。 作 为 合格 的 贝 叶 斯 主义 者 ， 你 的 预测 是 概率 性 的 ， 认 为 咖啡 渍 出 现在 某 
些 地 方 的 可 能 性 理论 上 会 比 出 现在 其 他 地 方 的 可 能 性 更 大 。 简 化 一 下 ， 比 如 说 你 
将 1000 颗 黑 色 沙 砾 放 在 地 面 上 ， 使 得 沙砾 密度 对 应 你 的 概率 预测 。 也 就 是 说 ， 你 
在 你 认为 咖啡 涡 更 可 能 出 现 的 地 方 放 上 更 多 沙砾 。 

一 年 过 去 了 ， 这 一 年 工作 人 员 特 别 笨 手 笨 脚 ， 酒 出 了 1000 个 咖啡 渍 。 在 每 一 
个 咖啡 总 上 ， 我 们 都 放 上 一 颗 黄 色 沙 砾 ， 现 在 在 仓库 的 地 板 上 就 有 1000 颗 黄 色 沙 
砾 和 1000 颗 黑 色 沙 砾 了 。 现 在 你 有 1000 只 蚂蚁 ， 每 只 蚂蚁 都 必须 将 一 颗 黑色 沙 
砾 运 到 某 颗 黄色 沙砾 旁边 ， 使 得 最 后 黑色 沙砾 和 黄色 沙砾 的 分 布 相 同 。 每 只 蚂 疏 
一 开始 都 能 训 无 障碍 地 迅速 行动 ， 但 一 旦 开始 运输 沙砾 ， 它 们 的 行动 就 会 变 得 异 
常 缓慢 。 最 后 ， 这 些 蚂蚁 会 组 织 起 来 ， 以 最 快 的 方式 解决 沙砾 的 运输 问题 。 这 样 
的 话 ， 这 些 蚂 尽 完成 任务 需要 的 平均 时 间 正 是 你 的 概率 性 预测 与 实际 数据 之 间 的 
沃 巧 斯 坦 距 离 。 

虽然 如 此 ， 即 使 沃 瑟 斯 坦 度量 一 般 来 说 很 适合 用 计算 机 计算 ,但 它 需 要 预先 
取 定 数据 之 间 相 似 性 的 度量 。 在 我 们 的 情况 中 ， 两 颗 沙 砾 的 相似 性 可 以 通过 它们 
之 间 的 距离 来 衡量 ， 然 而 在 许多 情况 之 中 ， 找 出 恰当 的 相似 性 度量 极其 困难 。 








































































































生成 式 对 抗 网 络 

















如 果 你 在 纸 上 画 了 几 只 猫 ， 那 么 哪 一 只 更 像 “ 真 正 ” 的 猫 呢 7? 你 要 怎么 做 才 
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能 量化 你 的 涂鸦 和 真正 的 猫 之 间 的 相似 性 ?怎么 定义 图 像 之 间 相 似 度 的 度量 ? 

这 些 问 题 的 用 处 并 非 只 局 限 在 “你 画 我 猪 ”( pictionary ) 游戏 中 。 测 定 文字 、 

声音 和 图 像 等 复杂 对 和 象 之 间 的 相似 性 "已 经 成 为 实用 贝 叶 斯 主义 者 发 起 的 最 困难 的 
挑战 之 一 。 这 是 因为 ， 真 正 有 趣 的 数据 实际 上 都 是 这 种 复杂 的 对 象 ， 比 如 拉 普 拉 
斯 的 著作 、 心 电 图 以 及 显微镜 下 缓 步 动 物 的 图 像 。 
我 们 以 宇宙 学 为 例 。 今 天 ， 这 个 领域 的 数据 基本 上 就 是 天 空 在 各 种 波长 下 的 
照片 ， 从 无 线 电 波 开始 ， 跨 越 微波 、 红 外 线 、 可 见 光 、 紫 外 线 、X 射线 ,一 直到 
射线 。 让 天 体 物 理学 家 深 深 着 迷 的 问题 ， 就 是 在 给 定 天 空 的 照片 国 的 情况 下 ， 得 
出 不 同 宇宙 学 模型 的 可 信和 参数 9。 这 就 是 贝 叶 斯 公式 的 典型 应 用 ! 
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这 个 计算 对 于 纯粹 贝 叶 斯 主义 者 来 说 易如反掌 ， 但 对 实用 贝 叶 斯 主义 者 来 说 却 难 
于 登 天 。 与 通常 的 情况 一 样 ， 分 母 太 长 难以 计算 。 但 问题 不 止 于 此 。 因 为 宇宙 学 
模型 都 非常 复杂 ， 即 使 是 思想 实验 项 PUERO] 需要 的 计算 时 间 也 会 超出 现实 的 限 
制 。 实 际 上 ， 正 因为 这 些 模 型 属于 贝 叶 斯 网 络 > ， 所 以 它们 在 构建 时 就 考虑 到 了 模 
拟 计算 的 可 行 性 。 也 就 是 说 ， 在 合理 的 时 间 内 ， 我 们 可 以 做 的 就 是 在 宇宙 学 模型 
参数 为 0 的 假设 下 ， 描 绘 模型 中 可 能 出 现 的 图 像 图 。 这 就 是 所 谓 的 生成 模型 ”。 
因此 ， 实 用 贝 叶 斯 主义 者 必须 依靠 某 些 方法 来 绕 过 对 思想 实验 项 的 直接 计算 。 
人 们 也 将 其 称 为 无 似 然 方法 (likelihood- free method )。 这 种 方法 有 很 多 变种 ， 比 
如 近似 贝 叶 斯 计算 ( Approximate Bayesian Computation， 简 称 ABC) 和 带 参数 贝 
叶 斯 间接 似 然 度 ( parametric Bayesian Indirect Likelihood， 简 称 pBIL )。 但 自从 
2014 FRE - 古 德 费 洛 及 其 合作 者 发 表 的 工作 U9 以 来 ， 一 种 特殊 的 无 似 然 方 法 似 
乎 赢得 了 大 量 研究 者 在 实用 上 的 置信 度 ， 那 就 是 生成 式 对 抗 网 络 〈 简称 GAN )。 
直观 来 说 ，GAN 的 想法 就 是 将 玩 “你 画 我 猜 ” 的 人 类 玩家 换 成 一 个 算法 ， 它 

























































































中 ”或 者 更 进一步 ， 也 可 以 考虑 文字 、 声 音 、 图 像 上 的 概率 分 布 。 

© 我们 会 在 第 17 章 再 提 到 这 一 点 。 

© 换 种 说 法 ， 生 成 模型 就 是 一 组 图 像 之 类 的 复杂 集合 上 的 概率 分 布 ， 但 它 只 能 通过 模型 仿真 来 
究 。 再 换 种 说 法 ， 生 成 模型 就 是 被 设计 成 用 于 取样 的 模型 。 我 们 会 在 第 17 章 进 行 更 深入 的 讨论 。 


































































































被 称 为 
真正 的 


“对 抗 者 ”或 


庞大 的 真实 图 像 库 中 抽 选 一 


像 来 自 哪里 ， 我 们 都 要 求 “ 对 抗 者 ” 
模型 正确 的 话 ， 从 直觉 上 来 说 


何 提 


出 ， 
TE 


WEE, Xt — A AHY 











“教师 ”。 这 位 
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图 像 有 多 相似 。 为 此 ， 我 们 先 抛 一 枚 硬币 ， 如 果 正 务 
张 图 像 ， 和 否则 要 求 模型 生成 一 张 
是 真实 图 像 的 贝 叶 
应 该 会 混 靖 两 种 可 能 





计算 出 它 
“对 抗 者 ” 


交 的 图 像 都 赋予 p= 1/2 的 概率 。 








重点 在 于 ， 为 了 让 “对 抗 者 ” 
在 图 像 为 真实 图 像 的 情况 下 ， 
H log; (1/01—p)) 的 代价 。 
此 外 ， 生 成 模型 随后 也 可 以 学 





乐于 
“对 抗 者 ” 






































斯 置信 和 度 p 





有 差 的 同一 个 分 数 也 可 以 月 
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“对 抗 者 ”的 任务 就 是 





衡量 模型 生成 的 图 像 与 








i 向 上 ， 那 么 我 们 就 在 





给 出 自身 的 贝 叶 斯 置信 和 度 
SHARM 反之 则 需 
岂 就 是 说 ， 我 们 以 符合 KL 散 度 的 方式 来 计算 分 数 。 
试 调整 参数 ， 使 得 生成 的 数据 更 接近 真实 数据 。 
的 意义 : 无 论 输 入 真实 的 图 像 ， 还 是 模型 生成 的 图 
像 ， 生 成 的 数据 需要 使 “对 抗 者 ”给 出 的 数值 p 尽量 靠近 p=1/2。 
量 “ 对 抗 者 ”的 贝 叶 


图 像 。 然 后 ， 无 论 图 
WEE p. WDR 
会 向 任 

















性 ， 也 就 是 


古 德 费 洛 等 人 提 





实际 上 ， 用 于 衡 





来 衡量 模型 的 表现 "1 
当 我 写 下 这 上段 话 的 时 候 ，GAN 风头 正 劲 。 其 惊人 效果 正 不 断 得 到 提升 ， 这 3 





HE 


要 得 益 于 深度 学 习 。2018 Æ, GAN 中 的 模型 和 “对 抗 者 ”实际 上 都 换 成 了 (CX 


积 ) 神经 网 络 ”。 正 因 它们 能 够 对 贝 叶 斯 公式 进行 无 





以 然 近 似 ， 再 加 上 神经 网 络 学 


习 的 常用 工具 ，GAN 获得 了 巨大 的 能 力 ， 足 以 生成 极其 难以 与 真实 照片 区 分 的 假 


RAT 





从 各 个 角度 来 说 ， 
[智能 激动 人 心 的 表现 。 
此 外 ,为 了 给 本 章 做 个 总 结 ， 








正 是 概率 性 预测 的 














我 想 再 





不 确定 性 的 重要 性 。 
我 们 必须 习惯 在 思考 中 考虑 不 确定 性 ， 

尝试 做 出 确定 性 的 预测 。 
无 论 原因 是 现实 的 物理 本 质 、 经 验 数 据 的 欠缺 、 

















(D 


D 一般 来 说 ， 模 型 就 是 一 个 深度 神经 网 络 9， SHE ^] 
对 模型 进行 模拟 就 会 输出 数据 GE) "X 
用 反问 传 播 算法 。 这 个 算法 外 





不 幸 的 是 ， 在 分 析 各 种 现象 














在 这 个 复杂 的 宇宙 














所 以 模型 和 “对 抗 者 ”实际 进行 的 是 零 和 博弈 




















在 于 能 够 应 
推 回 去 ， 用 以 改进 生成 模型 
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新 度量 方法 的 出 现 才 造就 了 这 些 现 


一 次 强调 在 判断 预测 质量 的 方法 中 考虑 
时 ， 人 们 往往 低估 随机 的 作用 。 
而 不 是 在 那些 本 质 上 不 可 预测 的 情境 中 也 

， 没 有 任何 认识 是 
混沌 现象 的 存在 ， 


确定 无 误 的 ， 
还 是 我 们 在 计 





于 生成 变量 z 的 “简单 ”概率 分 布 。 
是 男 一 个 深度 神经 网 络 D。 这 种 结构 的 好 处 就 
E 确 定 为 什么 D 选择 了 p # 112， 然 后 将 这 项 信息 倒 


4 G。 在 这 种 意义 上 ，D 更 像 是 “教师 ”， 而 不 是 “对 抗 者 ”。 
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算 能 力 上 的 限制 。 

绝 大 部 分 预测 问题 没有 简单 一 致 的 回答 ， 回 答 这 类 问题 时 要 谨慎 。 只 有 最 终 
承认 大 量 事件 发 生 的 原因 都 是 运气 不 好 ， 这 种 谨慎 才 站 得 住 脚 。 因 此 ， 对 模型 与 
预测 的 判断 必须 能 量化 不 确定 性 。 量 化 不 确定 性 实在 非常 重要 ， 这 件 事 不 能 被 随 


意 决 定 。 
































我 们 的 记忆 是 一 个 比 宇宙 更 完美 的 世界 : 它 
给 不 存在 的 事物 赋予 了 生命 1 


居 伊 . fé + 莫泊桑 (1850—1893 ) 


不 要 相信 你 的 记忆 。 如 果 有 人 问 你 能 不 能 想 


起 


某 件 事 ， 你 就 说 不 能 。 


KFE + À (1987— ) 


#16: 


记忆 缺陷 


数据 的 价值 





近年 来 ， 我 们 看 到 另 一 个 流行 术语 的 兴起 ， 那 就 是 大 数据 。 然 而 ， 对 于 这 个 








领域 的 许多 专家 而 言 ， 这 个 流行 术语 并 没有 带 来 经 济 上 的 相 变 。 大 数据 一 直 都 在 ， 


而 

















日 一 直 以 来 都 旦 指数 增长 。 毕 竞 计算机 科学 也 叫 信息 学 ， 而 “信息 ”就 是 “ 数 











据 ” 的 同义词 。 虽 然 大 数据 没有 改变 信息 技术 的 最 前 治 ， 但 这 个 概念 强调 了 数据 














在 工业 、 经 济 和 社会 中 的 核心 地 位 。 





我 在 搬 到 瑞士 的 时 候 尤 其 切身 感受 到 了 这 一 点 。 寻 找 住处 、 建 立 租赁 档案 ， 

















以 及 房东 和 租 客 签订 合同 ， 都 需要 极为 烦琐 的 书面 流程 ， 令 人 想起 阿 斯 泰利 克 









































斯 的 十 二 壮举 之 一 "。 为 了 搞 清 楚 洛桑 租房 市 场 的 情况 ， 我 必须 在 各 种 邮件 列表 、 











D 





阿 斯 泰利 克 斯 是 在 法 国 极 受 欢迎 的 同名 系列 幽默 漫画 《 阿 斯 泰利 克 斯 历险 记 》( 4stérix ) 的 主 
角 ， 故 事 设 定 在 公元 前 50 年 被 古 罗马 侵略 的 高 卢 地 区 ， 主 角 的 村 子 里 有 一 种 神奇 药水 ， 可 以 
WANKER, 而 主角 一 行 借助 这 种 药水 不 断 抵抗 古 罗 马 人 的 入 侵 ， 也 借 此 完成 众多 壮 
举 。 一 一 译 者 注 
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Facebook 群 组 和 租赁 中 介 网 站 上 注册 。 整 个 寻找 过 程 需要 花 上 几 小 时 甚至 几 天 的 
脑力 劳动 ,但 它 本 应 可 以 轻松 交 由 高 效 的 推荐 算法 完成 。 
更 糟糕 的 是 ， 为 了 完成 租赁 档案 ， 首 先 要 收集 来 自 众 多 机 构 的 文件 ， 其 中 有 
雇主 、 检 察 机 构 和 银行 ,然后 这 些 文件 将 被 移交 给 男 一 个 机 构 ， 比 如 房地产 中 介 。 
奇怪 的 是 , 今天 这 些 文件 还 必须 由 我 本 人 传达 ， 即 使 这 只 是 对 相关 机 构 数 据 库 进 
行 儿 次 简单 的 查询 就 能 完成 的 事情 一 一 当然 需要 得 到 我 的 同意 ， 但 这 也 可 以 用 电 
子 方式 完成 。 房 地 产 中 介 (或 者 房东 ) 其 实 理应 可 以 直接 向 雇主 、 检 察 机 关 和 银 
行 要 求 得 到 关于 我 的 信息 。 
意识 到 这 一 点 之 后 ， 我 不 得 不 抱怨 一 下 现行 手续 的 低 效 和 所 需 的 费用 了 。 
打印 一 份 证 明 我 已 经 开始 申请 工作 许可 的 行政 文件 就 要 花 20 瑞士 法 即 〈 约 合 144 
元 人 民 币 )， 而 访问 数据 库 连 一 分 钱 都 不 用 ， 得 出 的 证 明 还 更 可 靠 。 

最 后 ， 时 至 今日 ,合同 的 撰写 和 签名 竟然 还 需要 纸 质 文档 。 我 必须 一 张 接 一 
张 地 填写 一 大 堆 表 格 ， 然 后 给 一 整 琶 文件 签字 ， 但 这 些 文件 我 只 是 粗略 看 过 。 真 
是 浪费 时 间 ! 为 什么 现在 还 需要 在 一 大 堆 各 种 各 样 的 文件 上 一 次 又 一 次 填写 姓名 
和 出 生年 月 ”讽刺 的 是 ,我 跟 瑞 士 洛桑 联邦 理工 学 院 的 教育 频道 ZettaBytes 合作 
的 视频 就 是 关于 电子 签名 上 和 区 块 链 握 的 ， 它 们 都 是 能 用 于 数据 与 合同 的 起 草 、 
签字 和 管理 的 现代 工具 。 

等 到 信息 管理 系统 彻底 计算 机 化 的 那 一 天 〈 已 经 越 来 越 近 了 )， 所 有 这 些 流程 
都 可 以 点 击 几 次 鼠标 来 启动 。 对 于 许多 行业 来 说 ， 这 一 天 已 经 来 临 了 。 购 买 音乐 、 
阅读 书籍 、 观 看 视频 都 已 经 数字 化 了 。 这 些 数字 化 服务 源头 的 公司 莲 勃 发 展 ， 已 
经 成 为 网 络 巨 头 ， 比 如 革 果 、 亚 马 逊 和 网 飞 。 这 些 公司 与 硅谷 的 其 他 公司 ， 特 别 
是 谷歌 、Facebook 和 Twitter， 抢 在 全 世界 之 前 认识 到 了 数据 的 价值 。 这 些 公 司 在 

这 些 数据 的 收集 、 管 理 和 分 析 上 投资 了 数 百 万 甚至 数 十 亿美 元 。 正 是 他 们 的 商业 
模式 引领 了 名 为 “大 数据 ”的 狂潮 。 
























































































































































数据 泛滥 





这 一 狂潮 将 我 们 卷 入 了 信息 发 展 中 一 个 奇妙 的 阶段 ， 因 为 产 出 的 数据 量 正在 
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超越 我 们 的 分 析 能 力 ， 其 至 储存 能 力 。 最 有 说 服 力 的 例子 就 是 大 型 强 子 对 撞 机 ， 
也 就 是 CERN 的 那个 巨大 的 粒子 对 撞 机 。 这 个 宏伟 的 地 下 设备 宽 十 几 千 米 ， 每 秒 
能 够 产生 数 十 亿 次 质子 对 撞 。 由 此 产 出 的 数据 如 此 庞大 ， 以 至 于 其 中 大 部 分 数据 
会 被 当场 舍弃 。 初 始 过 滤器 让 人 们 能 够 挑 出 那些 可 能 在 物理 学 上 有 意义 的 数据 。 
但 即使 经 过 了 这 一 步 极 严格 的 筛选 ， 需 要 储存 的 信息 仍然 要 以 千 万 亿 字 节 (PB ) 
来 计算 ， 用 于 处 理 这 些 数据 的 机 器 装 满 了 好 几 个 房间 。 

CERN 现在 只 能 满足 于 这 种 做 法 ， 而 这 也 可 能 是 所 有 面 对 大 数据 的 企业 的 未 
来 ， 因 为 数据 量 的 增长 速度 要 比 储存 空间 的 增长 速度 更 快 ! 目前 我 们 还 有 给 数据 
做 儿 次 备份 的 空间 ， 但 这 样 的 情况 不 会 长 久 。 我 们 很 快 就 必须 抛弃 一 大 部 分 ， 其 
至 绝 大 部 分 收集 来 的 数据 。 此 外 ， 我 们 现在 还 能 看 到 各 种 传感器 激增 以 及 物 联网 
的 出 现 ， 选 择 保 存 什么 数据 正 要 成 为 信息 处 理 历 史上 的 魏 新 问题 。 

大 数据 除了 给 储存 带 来 了 严峻 的 问题 之 外 ， 也 给 计算 时 间 出 了 道 难题 。 假 设 
你 要 在 上 亿 亿 条 信息 中 搜寻 其 中 一 项 ， 即 使 以 每 秒 处 理 上 亿 项 数据 的 速度 ( 相当 
于 你 的 计算 机 里 的 微 处 理 器 的 速度 ) 也 需要 许多 天 才能 完成 任务 ! 为 了 避 开 这 些 
关于 储存 与 响应 时 间 的 问题 ， 众 多 数据 科学 家 已 经 在 想象 如 何在 不 储存 原始 数据 
的 情况 下 解决 这 些 问题 了 。 










































































厕所 问题 





想象 一 下 ， 你 现在 身 处 节日 庆典 ， 却 有 些 内 急 。 面 前 有 300 个 厕所 排 成 一 条 
长 街 ,但 这 些 厕所 都 脏 得 可 怕 ， 你 尝试 找到 其 中 最 干净 的 那个 。 但 你 身后 还 跟着 
一 排队 伍 ， 一 且 你 关上 一 个 而 所 的 门 去 看 下 一 个 而 所， 就 不 能 回 到 之 前 的 厕所 了 ， 
因为 有 人 已 经 捷足先登 。 换 名 话说 ， 你 必须 在 看 到 某 个 厕所 的 时 候 就 决定 是 否 进 
去 。 怎 么 样 才能 使 你 用 上 最 干净 的 而 所 的 可 能 性 最 大 化 ? 

这 个 问题 已 经 成 了 数学 中 的 经 典 问题 口 。 在 1960 年 由 马丁 :加 德 纳 提出 的 这 
个 问题 拥有 好 儿 个 名 字 ， 比 如 秘书 问题 、 古 七 尔 游戏 、 未 婚 妻 问题 或 苏丹 聘 金 问 
题 。 这 些 表达 方式 都 是 等 价 的 ， 都 基于 下 面 这 个 两 难 的 境地 : 你 有 一 些 按 顺 序 出 
现 的 数据 ， 而 且 你 必须 在 接受 所 有 数据 之 前 就 做 出 选择 ， 因 为 机 会 会 随 着 时 间 
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流逝 。 

这 个 问题 变 得 如 此 有 名 ， 最 重要 的 一 个 原因 就 是 它 有 着 非常 反 直 觉 的 漂亮 
解答 。 实 际 上 ， 如 果 应 用 最 优 策略 的 话 ， 那 么 找到 最 干净 的 厕所 的 概率 大 概 是 
37%0。 这 个 最 优 策略 就 是 先 查 看 大 概 37% 的 厕所 后 全 部 放弃 ， 然 后 选择 第 一 个 比 
前 面 都 更 干净 的 而 所。 最 令 人 惊讶 的 是 ， 这 个 非常 简单 的 策略 总 是 能 保证 以 37% 
的 概率 找到 最 干净 的 而 所， 哪怕 面 对 几 千 个 、 几 亿 个 ， 其 至 10 的 古 苞 尔 次 方 (10 
的 101 次 方 ) 个 厕所 2? ! 

在 这 个 问题 的 解答 中 ， 最 引 人 注 目的 一 点 就 是 用 到 的 算法 几乎 不 需要 记 住 什 
么 东西 。 算 法 必须 记 住 的 唯一 数据 ， 就 是 已 经 查看 过 的 较 干 净 的 厕所 的 干净 程度 。 
它 可 以 完全 忘记 查看 过 的 其 他 厕所 。 

话 虽 如 此 ， 我 很 不 建议 在 实践 中 采用 这 一 策略 。 这 一 策略 能 将 找到 最 干净 的 
而 所 的 概率 最 大 化 ， 但 并 没有 指出 它 失 败 的 后 果 。 其 实 ， 通 常 你 放弃 了 所 有 厕所， 
不 得 不 接受 最 后 那 一 个 。 这 种 灾难 性 的 情况 出 现 的 概率 甚至 有 37% ! 


















































信息 洪流 的 高 速 处 理 





厕所 问题 启发 人 们 提出 了 大 量 的 变 体 ， 它 们 可 以 作为 大 量 问题 的 模型 ， 尤 其 
是 互联 网 的 出 现 带 来 的 那些 问题 ， 每 个 变 体 都 可 以 导出 不 同 的 算法 作为 解答 。 
管 如 此 ， 这 些 算法 带 来 的 解法 似乎 有 着 一 般 性 的 原则 ， 适 用 于 在 数据 洪流 之 中 以 
有 限 储存 空间 做 出 决策 。 

其 中 一 种 变 体 特别 强调 了 抓 住 眼前 的 机 会 与 等 待 更 好 的 机 会 的 两 难 境地 ， 尤 
其 是 对 于 选择 非常 多 、 包 含 各 种 各 样 的 特征 并 且 可 以 一 次 接受 多 个 选择 的 情况 。 
对 这 些 问 题 的 研究 通常 被 称 为 实时 优化 或 者 在 线 优化 。 与 之 相关 的 重要 应 用 包括 
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实际 上 这 个 数字 等 于 le， 其 中 e 是 欧 拉 常数 。 
对 于 厕所 数目 较 少 的 情况 ， 最 优 的 停止 时 间 更 小 ， 找 到 最 干净 的 厕所 的 概率 也 更 大 。 如 果 有 
2 个 或 者 3 个 布 所 ， 最 优 策 略 找到 最 干净 的 布 所 的 概率 是 112。 如 果 而 所 的 个 数 在 4 和 10 之 
间 ， 这 个 概率 会 从 46% 下 降 到 40%, 26 个 厕所 对 应 的 概率 会 下 降 到 38%， 而 150 个 而 所 对 
应 的 概率 会 下 降 到 37%， 但 总 是 大 于 36.7896 ! 
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有 限 资源 的 分 配 问题 、 演 唱 会 门票 发 售 与 互联 网 广告 相关 的 问题 。 对 应 的 解决 方 
法 通常 是 根据 过 往 数 据 对 资源 进行 量化 估计 ， 无 论 是 通过 对 问题 中 相关 约束 的 研 
究 "， 还 是 通过 包含 积 性 权重 更 新 的 类 贝 叶 斯 算法 变 体 。 

这 个 问题 的 另 一 个 变 体 强调 的 则 是 我 们 对 于 问题 中 数据 的 概率 性 描述 怀 有 的 
不 确定 性 。 也 就 是 说 ， 这 些 问 题 考 察 的 不 是 作为 不 确定 性 的 偏见 ， 而 是 偏见 本 身 


的 不 确定 性 。 


学 习 或 在 线 学 习 。 探 索 就 是 优先 进行 可 能 代价 高 昂 的 测试 ， 以 此 收集 数据 来 改进 




































































因此 ， 这 产生 了 探索 与 利用 之 间 的 两 难 问 题 ， 人 们 也 把 它 称 为 实时 





























贝 叶 斯 置信 度 ; 利用 则 是 在 给 定 置信 和 度 的 情况 下 进行 最 优 决策 。 汤 普 森 的 抽样 贝 








测试 )。 








叶 斯 算法 给 出 了 这 个 两 难 困 境 的 解决 办 法 ， 因 此 它 可 以 用 于 决定 是 否 对 罪犯 提起 
诉讼 ， 或 者 是 否 应 该 提前 终止 药物 实验 ， 以 及 互联 网 新 产品 的 测试 (又 叫 A/B 











最 后 ， 厕 所 问题 的 第 三 个 变 体 强调 的 是 计算 时 间 上 的 限制 一 一 但 这 次 允许 重 
新 考虑 过 往 的 数据 。 想 象 一 下 你 刚度 假 回 来 ， 必 须 在 度假 时 拍 的 2000 张 照片 里 





选 出 最 好 的 10 张 。 除 此 之 外 ， 这 个 问题 还 有 额外 的 障碍 : 必须 注意 避免 选择 重复 
的 照片 。 而 所 问题 算法 的 一 个 变 体能 够 用 于 解决 这 个 问题 及 其 变 体 ， 那 就 是 贪心 
算法 。 这 个 算法 首先 会 根据 照片 之 间 的 协同 关系 先 选 出 它 看 到 的 最 好 的 一 张 照片 ， 
然后 选 出 与 这 张 选 定 照 片 协 调 得 最 好 的 一 张 照 片 ， 接 下 来 选择 与 前 两 张 选 定 照片 
协调 得 最 好 的 一 张 照 片 ， 以 此 类 推 。 不 如 人 意 的 是 ， 这 个 方法 一 般 来 说 并 非 最 优 ， 
因为 它 无 法 预测 某 张 选 定 的 照片 与 以 后 会 出 现 的 照片 之 间 的 协同 关系 。 人 们 也 说 
贪心 算法 是 短视 的 。 尽 管 如 此 ， 人 们 证 明了 这 种 短视 可 以 保证 贪心 算法 是 最 好 的 


启发 式 算法 ， 
最 近 数 和 























尤其 是 在 与 随机 化 结合 之 后 “。 
FE 来， 依靠 贪心 方法 、 对 资源 价值 的 量化 、 对 知识 不 确定 性 进行 适当 























管理 的 算法 广 受 瞩 目 。 在 网 络 巨头 的 眼中 尤其 如 此 ， 它 们 旗下 的 研究 团队 在 这 类 
算法 性 质 的 理论 研究 中 非常 活跃 。 大 数据 时 代 的 降临 大 概 只 是 加 快 了 这 一 趋势 。 





























中 ”也 就 是 所 谓 的 对 偶 变 量 以 及 拉 格 朋 日 乘 子 。 
G 比如 说 ， 做 法 可 以 是 在 与 已 选 出 的 照片 协调 得 最 好 的 10 张 照 片 中 随机 选择 一 张 。 
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卡尔 曼 滤波 器 


然而 ， 厕 所 问题 的 各 种 变 体 一 般 都 会 假设 未 来 类 似 于 过 去 "。 这 就 解释 了 为 
什么 解决 这 些 问 题 通常 无 须 很 多 储存 空间 。 为 了 处 理 动态 变化 的 情况 ， 机 器 学 习 
就 必须 预期 变化 的 存在 。 完 成 这 一 壮举 的 经 典 模 型 就 是 卡尔 曼 滤 波 器 ( Kalman 
filter )， 它 的 名 字 来 自 天 才 鲁 道夫 ' 卡尔 曼 ， 此 外 还 有 它 的 各 种 推广 ， 比 如 隐 马 尔 
可 夫 模 型 ( hidden Markov model ). 

想象 一 下 ,你 的 汽车 希望 得 知 自身 的 位 置 和 速度 。 按 照 正确 的 贝 叶 斯 主义 做 
法 ， 它 首先 会 仔细 描画 自身 知识 的 欠缺 之 处 。 它 可 以 利用 加 上 误差 的 平均 估计 来 
为 这 种 欠缺 建 模 。 卡 尔 曼 假设 这 些 误差 会 遵循 某 种 高 斯 分 布 ， 其 论据 主要 是 中 心 
极限 定理 。 这 个 假设 的 用 处 非常 广 ， 尤 其 是 因为 遵循 高 斯 分 布 的 随机 变量 相 加 之 
后 仍然 遵循 高 斯 分 布 ， 而 且 高 斯 分 布 的 密度 函数 相 乘 之 后 得 到 的 仍然 是 高 斯 分 布 。 
但 你 不 要 担心 ， 在 这 里 我 就 不 具体 写 出 计算 过 程 了 。 

我 们 能 观察 到 一 个 令 人 泪 吧 的 事实 ， 那 就 是 每 一 步 之 间 都 会 加 入 新 的 不 确定 
性 。 汽 车 可 能 加 速 了 ， 而 对 于 这 个 加 速 的 所 有 测量 都 伴随 着 误差 ， 它 会 加 剧 已 有 
的 不 确定 性 。 因 此 ， 时 间 过 得 越久 ， 误 差 累积 得 越 多 ， 我 们 对 于 汽车 的 位 置 和 速 
度 就 越 不 确定 。 

为 了 减少 这 种 不 确定 性 ， 我 们 可 以 利用 其 他 测量 仪器 得 出 的 测量 结果 。 但 是 ， 
这 些 测 量 结果 同样 拥有 不 确定 性 。 尽 管 如 此 ， 如 果 将 前 一 刻 推 断 出 来 的 位 置 和 速 
度 与 不 同 测量 仪器 得 出 的 不 同 测量 结果 结合 起 来 ”， 卡 尔 曼 滤波 器 就 能 让 我 们 推导 
出 描述 汽车 位 置 和 速度 的 后 验 高 斯 分 布 ， 这 里 的 “后 验 ” 指 的 是 在 得 知 测量 仪器 
给 出 的 数据 之 后 。 正 因为 有 了 这 些 额 外 数据 ， 后 验 分 布 会 变 得 比 之 前 更 准确 。 

今天 ， 这 种 卡尔 曼 滤 波 器 在 大 量 领域 中 都 得 到 了 应 用 (图 16.1 )。 我 们 理 所 当 
然 能 在 有 关 导 航 和 轨迹 控制 的 大 量 问题 中 找到 它 的 身影 ， 它 同样 出 现在 信号 处 理 、 
经 济 计量 学 、 电 池 电 量 估 计 、 计 算 机 系统 界面 、 粒 子 探测 器 、 计 算 机 视觉 、 断 层 
扫描 成 像 、 地 震 学 、 健 康 监测 和 气象 预测 等 领域 中 。 关 键 在 于 ， 它 其 实 只 是 贝 1 
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© 人们 一 般 会 假设 数据 是 独立 同 分 布 的 ， 这 其 实 遵循 了 频率 主义 的 传统 做 法 ! 
D ”条件 就 是 这 些 测量 必须 是 汽车 位 置 和 速度 的 线性 函数 。 
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斯 公式 ， 不 过 利用 了 几 个 有 用 的 前 提 ， 比 如 ， 不 确定 性 遵循 高 斯 分 布 ， 变 量 之 间 
有 线性 关系 ， 还 有 问题 中 的 不 同 变量 由 某 种 结构 联系 起 来 。 






























































图 16.1 卡尔 曼 滤 波 器 是 隐 马 尔 可 夫 模 型 的 特例 。 这 类 模型 描述 了 由 隐藏 的 内 部 状态 产生 
的 外 部 演变 过 程 。 在 每 一 个 时 刻 ， 内 部 状态 都 会 产生 外 部 可 观察 的 数据 





这 种 结构 又 叫 隐 马 尔 可 夫 模 型 ， 其 中 包含 所 谓 的 隐 含 变量 ， 它 在 每 一 个 时 刻 
的 取 值 都 是 未 知 的 。 在 汽车 的 例子 中 ， 这 些 隐 含 变量 就 是 汽车 的 位 置 和 速度 。 此 
外 ,我们 假设 这 些 隐 含 变 量 在 每 一 个 时 刻 都 会 导出 可 观察 的 变量 。 在 汽车 的 例子 
中 ， 那 就 是 测量 仪器 得 出 的 数据 。 直 观 来 说 ， 汽 车 的 位 置 和 速度 产生 了 这 些 测量 
数据 。 因 此 ， 给 定 前 一 个 时 刻 隐 含 变量 的 可 能 取 值 ， 以 及 当前 时 刻 仪器 测量 到 的 
数据 ， 贝 叶 斯 公式 就 能 让 我 们 计算 隐 含 变量 在 每 个 时 刻 的 可 能 取 值 。 

就 像 我 们 在 下 一 章 会 详细 谈 到 的 各 种 带 有 隐 仿 变量 的 模型 那样 ， 隐 马尔 可 夫 
模型 也 拥有 众多 应 用 ， 作 为 卡尔 曼 滤 波 帮 的 推广 ， 它 当然 也 能 应 用 到 与 之 相关 的 
问题 中 。 尤 其 关键 的 是 ， 这 些 模 型 能 够 实时 对 海量 数据 做 出 反应 ， 无 须 额 外 的 储 
存 空间 ， 因 为 需要 保存 的 只 有 隐 含 变量 概率 分 布 的 描述 ,但 这 一 描述 一 般 非常 简 
洁 ， 在 卡尔 曼 滤波 器 所 用 的 高 斯 分 布 框架 中 尤其 如 此 。 但 在 一 般 情 况 下 ， 如 果 隐 
藏 变量 取 值 的 可 能 性 不 多 的 话 ， 这 种 说 法 也 成 立 。 这 就 是 为 什么 面 对 大 数据 的 泛 
滥 ， 隐 马尔 可 夫 模 型 大 有 可 为 。 






















































































ll 









































面 对 大 数据 的 人 类 大 脑 


这 些 算法 似乎 都 离 日 常生 活 非 常 怕 远 。 你 可 能 会 说 你 能 够 一 一 记 住 自己 接收 
的 所 有 数据 ， 但 这 就 错 得 离谱 了 。 
人 们 可 能 从 未 察觉 ， 每 时 每 刻 充 斥 我 们 大 脑 皮层 的 数据 量 大 得 可 怕 ， 有 如 
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CERN 需要 处 理 的 数据 量 。 我 们 的 视觉 、 听 觉 、 嗅 觉 、 触 觉 、 温 度 感觉 ， 以 及 其 
他 数 不 清 的 感 党 ， 每 秒 都 会 向 我 们 传输 大 约 十 亿 字 节 (IGB) 的 数据 外。 如果 我 们 
把 数 十 年 间 收 集 到 的 数据 累计 起 来 的 话 ， 我 们 会 发 现 感官 接收 到 的 数据 总 量 需 要 
用 百 亿 亿 字 节 ( EB ) 作为 计量 单位 ! 这 可 以 说 是 大 得 可 怕 。 

与 现代 信息 技术 面 对 的 情况 类 似 ， 我 们 的 大 脑 也 无 法 储存 自身 接收 到 的 所 有 
数据 。 它 也 不 想 这 样 做 ， 因 为 其 中 绝 大 部 分 数据 没有 意义 ， 它 不 得 不 忘记 绝 大 部 
分 数据 。 

在 视觉 数据 的 处 理 中 ， 这 种 状况 尤其 突出 。 据 神经 科学 家 马 库 斯 * dicare: 0, 
我 们 的 视 皮 层 拥有 惊人 的 能 力 ， 可 以 将 十 亿 字 节 的 视觉 数据 转换 为 几 千 字 节 的 有 
用 数据 ， 这 种 处 理 在 每 一 秒 都 在 进行 ， 而 且 只 需要 消耗 极 少 的 能 量 "。 

在 更 普遍 的 意义 上 ， 大 脑 会 优先 保留 数据 的 “大 体 概念 "， 而 不 是 具体 细节 。 
一 般 来 说 ， 我 敢 打赌 你 不 能 背 出 这 本 书 前 15 章 中 的 任意 一 句 话 。 但 在 我 的 期 望 
中 ， 你 应 该 记 住 了 这 些 章节 讨论 的 是 贝 叶 斯 公式 、 它 的 逻辑 基础 、 它 在 归纳 推理 
问题 上 的 应 用 、 它 的 历史 、 所 罗 门 诺 夫 妖 及 其 在 博弈 论 中 的 应 用 ， 甚 至 还 有 它 与 
演化 理论 之 间 的 联系 。 即 使 你 可 能 没有 记 住 读 到 的 任何 一 个 句子 ,但 我 仍然 希望 
你 记 住 了 读 到 的 文字 中 各 种 基础 概念 的 抽象 表达 。 
对 于 接收 到 的 信息 只 保留 压缩 过 后 的 表示 ， 这 种 能 力 并 非 弱 点 ， 而 正 是 大 脑 
的 强大 之 处 。 我 们 一 般 都 能 够 回忆 起 那些 重要 的 事物 ， 而 且 完全 忘却 那些 对 我 们 
来 说 无 足 轻重 的 东西 。 





























































































































擦 除 记 忆 创 伤 


但 这 种 说 法 并 非 无 可 挑 易 。 遗 憾 的 是 ， 我 们 有 时 候 会 忘记 那些 本 和 希望 记得 的 
事情 ， 或 者 记 住 那些 本 想 要 忘却 的 东西 。 正 因 如 此 ， 在 战场 上 目睹 凄惨 景象 的 退 
伍 老 兵 经 常 受 到 精神 上 的 创伤 ， 而 且 和 久久 不 能 忘怀 。 虽 然 程 度 远 不 如 前 者 严重 ， 
但 我 们 每 一 个 人 都 或 多 或 少 地 惧怕 着 某 些 东西 ， 而 且 我 们 通常 希望 忘记 这 些 事情 。 
































CD 赖 希 勒 估计 ， 我们 的 视网膜 每 秒 会 收集 到 大 约 10° 比特 的 数据 ， 但 到 达 初 级 视 皮 层 的 第 四 
的 数据 只 有 大 约 10 比特 。 
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ILARA AEREA? 令 人 惊讶 的 是 ， 心 理学 家 梅 雷 尔 ， 金 特 证 明 
了 答案 是 肯定 的 ! 2016 年 美国 公共 广播 电视 公司 (PBS )《 新 星 》( NOVA ) 系列 
的 纪录 片 《 记 忆 黑 客 》( Memory Hackers ) 中 展示 了 金 特 为 众多 患者 之 一 治疗 蜂 蛛 
和 恐惧 症 的 过 程 。 为 此 ， 金 特 要 求 患者 观察 狼 蛛 ， 借 此 唤起 患者 的 恐惧 。 在 这 时 ， 
她 借 此 机 会 让 患者 服用 普 茜 洛 尔 ， 这 种 药物 的 分 子 会 插入 神经 元 之 间 ， 中 断 神 经 
元 的 通信 。 据 金 特 所 说 ， 这 会 妨碍 对 于 处 慢 的 回忆 ， 其 至 会 使 其 消失 。 这 的 确 有 
效 ! 第 二 天 ， 患 者 就 可 以 抚摸 狼 蛛 了 ， 就 好 像 那 是 温驯 的 仓鼠 一 样 。 

个 领域 的 研究 还 处 于 初级 阶段 ,但 金 特 以 及 其 他 研究 人 员 的 工作 也 许可 以 
提供 治疗 某 些 药物 成 瘾 或 者 创伤 后 应 激 障碍 的 新 方法 。 这 些 工作 指出 了 一 个 已 经 
确立 的 反 直 觉 的 事实 : 记忆 储存 于 突 触 连接 之 中 。 

与 20 世纪 初 的 神经 科学 家 的 想法 相反 ， 长 期 记忆 并 非 对 应 着 特定 神经 元 内 部 
储存 的 信息 。 当 我 们 在 回忆 时 ， 大 脑 皮层 中 涌现 出 一 波 波 神经 激活 。 正 是 这 些 波 
涛 的 纹路 刻画 了 我 们 的 记忆 。 这 些 记忆 藏身 于 神经 元 的 连接 方式 之 中 ， 而 非 神经 
元 自身 的 物理 状态 之 中 。 因 此 ， 与 回忆 相关 的 信息 并 非 聚集 在 大 脑 的 特定 区 域 之 
中 ， 而 是 遍布 于 组 成 大 脑 的 神经 网 络 连接 之 

所 以 说 ， 大 脑 短 期 记忆 和 长 期 记忆 的 关系 就 跟 网 页 浏览 融和 互联 网 的 关系 一 
样 。 为 了 访问 感 兴趣 的 网 页 ， 你 必须 找到 这 个 网 页 的 所 谓 URL 链接 。 一 旦 你 知道 
了 这 个 链接 ， 浏 览 器 就 能 轻易 探索 整个 互联 网 ， 找 到 所 有 必需 的 信息 来 泻 染 你 希 
望 访问 的 这 个 网 页 。 然 而 如 果 你 丢失 了 这 个 链接 ， 要 重新 找到 这 个 网 页 就 难于 登 
天 了 一 一 就 像 你 在 尝试 回忆 时 ， 明 知 自己 有 这 上 段 记 忆 却 死活 记 不 起 来 ， 这 种 经 历 
AJ RER S ABE 

这 个 观察 结果 的 一 个 推论 就 是 ， 在 回想 起 某 段 回忆 的 时 候 ， 与 其 相关 的 神经 
激活 浪 漠 也 会 被 重新 激活 ， 能 让 这 段 记 忆 更 深刻 。 回 忆 能 帮助 以 后 的 回忆 。 然 而 
在 回忆 与 回忆 之 间 ， 神 经 激活 的 浪潮 也 会 轻微 变化 ， 就 像 水 流 一 样 。 此 外 ， 普 蔡 
洛 尔 也 会 起 推波助澜 的 作用 ， 它 能 大 大 影响 这 一 浪潮 的 轨迹 ， 比 如 切断 它 跟 大 脑 
中 负责 丽 惧 的 区 域 之 间 的 联系 。 似 乎 正 是 这 种 被 外 力 偏转 的 神经 激活 浪潮 改变 了 
记忆 ， 令 恐惧 消失 。 
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虚假 回忆 




















如 果 说 回忆 可 以 向 好 的 方面 改变 ， 那么 它 也 能 变 得 更 糟糕 。 这 就 是 朱 莉 
娅 .省 等 心理 学 研究 者 一 次 又 一 次 发 现 的 事实 。 朱 和 莉 姥 ， 肖 尤 为 特别 ， 她 开展 了 
一 项 可 怕 的 实验 ， 可 能 会 引发 对 司法 系统 的 质疑 。 这 一 实验 展示 了 让 被 试 相信 自 
己 违法 是 多 么 容易 的 事情 ， 即 使 他 们 没有 违法 ! 

首先 ， 朱 莉 娅 . 省 向 被 试 宣称 实验 的 目的 是 研究 儿童 时 期 的 回忆 。 然 后 她 辐 
被 试 讲述 了 一 段 虚构 的 经 历 ， 却 直言 这 段 经 历 是 被 试 的 父母 提供 的 。 这 段 经 历 就 
是 被 试 的 一 次 违法 行为 。 故 事 本 身 并 不 荒 雇 ， 尤 其 是 因为 它 重 新 利用 了 被 试 过 去 
经 历 的 一 些 内 容 ， 比 如 地 点 和 相关 人 士 的 名 字 。 被 试 一 开始 会 反驳， 说 他 们 并 没 
有 这 样 的 记忆 。 然 而 朱 莉 娅 ， 肖 接 下 来 会 要 求 他 们 放松 ,不 经 意 地 诉 诸 他 们 的 想 
象 。 她 告诉 被 试 ， 其 他 人 也 通过 这 种 方式 唤起 了 童年 的 回忆 ， 以 鼓励 他 们 回忆 。 
通过 这 种 方法 ， 朱 莉 娅 ， 肖 激 活 了 被 坛 脑 中 与 童年 回忆 相关 的 神经 元 ， 从 而 启动 
了 巩固 (以 及 自 改 ) 回忆 的 相关 机 制 ! 然后 朱 莉 娅 '， 肖 让 被 试 继续 思 考 这 些 回忆 
和 故事 ， 但 不 要 跟 别人 讨论 。 

一 周 之 后 ， 朱 莉 娅 ， 肖 对 被 试 回访 。 被 试 首 先 讲述 了 一 段 对 他 们 来 说 似乎 有 
可 能 发 生 过 的 经 历 ， 但 用 到 了 不 少 表示 犹 殉 的 词语 。 两 个 星期 之 后 ， 这 些 词 语 消 
失 了 ， 被 试 对 自己 讲述 的 经 历 更 有 把 握 。 令 人 惊异 的 是 ，70% 的 被 试 都 说 服 了 自 
己 以 前 违反 过 法 律 ! 朱 莉 娅 ， 肖 的 实验 给 被 试 带 来 的 震撼 如 此 巨大 ， 以 至 于 她 提 
前 终止 了 这 场 实 验 。 

AE 'PPRUAGUUP. 肖 的 实验 表明 ， 我 们 不 能 相信 自己 的 回忆 。 我 们 的 回忆 并 不 
精确 ， 充 满 模 糊 之 处 ， 特 别 是 在 每 一 次 重新 回忆 时 ， 它 会 又 一 次 被 调整 、 加 工 和 
改编 。 而 最 麻烦 的 是 ,我们 基本 上 对 此 毫 无 察觉 ! 然而 ,我 们 的 司法 系统 依赖 于 
法 官 和 陪审 团 的 回忆 ， 而 这 些 回忆 又 是 来 自 证 人 和 嫌疑 人 的 回忆 。 无 论 是 法 官 、 
陪审 团 、 证 人 还 是 嫌疑 人 的 回忆 ， 都 会 被 不 同 律师 的 雄辩 和 感人 之 词 所 调整 、 加 
工 和 改编 。 我 们 实际 上 又 能 对 这 样 的 回忆 赋予 多 少 置信 度 呢 ? 大 概要 比 实践 中 的 
置信 和 度 要 少 得 多 。 因 此 ， 心 理学 家 伊丽莎白 洛 夫 特 斯 研究 了 一 百 多 个 案例 ， 证 
明了 在 四 分 之 三 的 案例 之 中 ,那些 原本 被 判 有 罪 但 被 DN A 测试 洗 清 嫌 疑 的 人 ， 当 
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时 都 是 因为 有 问题 的 目击 证 言 被 定罪 的 四 。 

我 们 不 能 相信 目击 证 言 ， 哪 伯 证 人 言 之 玄 凿 。 实 际 上 ， 要 让 证 人 相信 自己 看 
见 了 某 些 其 实 错误 百出 的 东西 实际 上 容易 得 令 人 难以 置信 。1999 年 ， 在 一 个 后 来 
出 了 名 的 实验 中 ,丹尼尔 : 西蒙 斯 和 克里斯托弗 查 布 里 斯 让 被 试 数 一 下 一 群 打 
篮球 的 人 互相 进行 了 多 少 次 传 球 。 你 可 以 在 网 络 上 找到 他 们 的 视频 中 ， 我 强烈 建 
议 你 在 继续 读 下 去 之 前 看 一 眼 这 个 视频 。 

关于 传 球 次 数 的 问题 ， 大 部 分 被 试 给 出 了 正确 的 答案 。 然 后 ， 西 蒙 斯 和 查 布 里 
斯 询问 被 试 有 没有 看 到 那 只 穿 过 篮球 场 的 大 猩猩 。 被 试 都 说 没有 看 到 。 更 糟糕 的 是 ， 
很 多 人 都 很 确定 地 说 没有 任何 穿 过 篮球 场 的 大 猩猩 。 否 则 他 们 早 就 看 到 了 ， 这 就 
是 他 们 的 说 法 。 但 慢 镜 关 证 明了 一 切 ， 那 里 赫然 有 一 只 大 猩猩 悄悄 地 穿 过 了 篮球 
场 ， 甚 至 还 花 了 点 时 间 跳 了 下 舞 。 那 些 忙于 进行 繁重 认 知 任务 的 被 试 遇 上 了 非 注 
意 言 视 ( inattentional blindness )。 更 严重 的 是 ， 他 们 并 没有 察觉 自己 的 琉 忽 。 在 这 
项 实验 以 及 其 他 许多 实验 之 中 外 ， 被 试 都 明显 对 自己 在 感知 上 的 能 力 过 度 自信 。 

还 有 其 他 认 知 偏差 使 得 我 们 的 处 境 雪上 加 霜 。 我 们 之 前 已 经 看 到 ， 心 理学 家 
乔纳森 海 特 断 言 我 们 总 是 尝试 通过 理性 来 为 自己 的 第 一 直觉 六 护 ， 这 就 意味 着 
我 们 很 乐意 调整 自己 的 回忆 。 此 外 ， 德 里 克 … 穆 勒 进而 证 明了 ， 让 学 生 观 看 那些 
对 违反 直觉 的 科学 现象 进行 严谨 解释 的 视频 ， 反 而 会 倾向 于 让 这 些 学 生 对 自己 非 
科学 的 错误 想法 更 有 自信 。 这 就 解释 了 为 什么 科学 界 最 终 拒绝 了 任何 目击 证 言 和 
个 人 体验 ， 无 论 做 出 这 些 证词 的 人 如 何 深信 不 疑 。 

关于 回忆 的 这 些 严重 问题 指出 了 大 脑 能 力 的 极限 ， 也 提示 我 们 要 大 大 降低 对 
于 回忆 的 置信 和 度 ， 对 于 建立 在 这 些 回忆 之 上 的 信念 也 是 如 此 。 我 们 生活 在 一 个 充 
斥 着 不 确定 性 的 世界 中 ， 未 来 当然 有 着 不 确定 性 ， 但 过 去 同样 如 此 一 一 甚至 当下 
亦 然 。 这 让 笛 卡 儿 开 始 条 分 缕 析 地 怀疑 所 有 他 可 以 怀疑 的 东西 ， 他 最 后 得 出 的 结 
论 就 是 只 有 一 件 事 物 是 考 良 置疑 的 ， 那 就 是 他 正在 思考 。 他 这 样 说 :“ 我 思 故 我 在 
( Cogito ergo sum )." 

然而 ， 这 么 做 太极 端 ， 这 种 激进 的 做 法 也 会 让 人 怀疑 科学 以 及 科学 界 早已 达 
成 的 共识 ， 比 如 疫苗 的 有 效 性 ， 还 有 人 类 导致 气候 变 暧 的 事实 。 对 于 纯粹 贝 叶 斯 
主义 者 来 说 ， 这 些 极端 怀疑 主义 者 的 错误 在 于 寻求 无 可 挑剔 的 真理 。“ 所 有 模型 都 
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是 错 的 ”>， 所 以 知识 并 不 在 于 刻画 那些 正确 性 无 可 争议 的 事实 或 者 理论 ， 而 更 应 该 
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我 们 之 前 看 到 ， 人 类 大 脑 令 人 叹服 的 地 方 之 一 ， 就 是 它 将 极 大 量 原始 数据 压 











对 于 不 同事 实 、 理 论 和 回忆 的 置信 度 的 计算 。 知 识 ， 旨 在 确定 合适 的 不 确定 程 
。 由 此 ， 讨 论 这 些 不 确定 性 的 正确 语言 并 不 是 真 假 分 明 的 经 典 逻 辑 ， 而 是 概率 
言 一 一 而 处 理 这 些 概 率 必 不 可 少 的 工具 就 是 贝 叶 斯 公式 。 



































叶 斯 帮助 记忆 





缩 为 寥寥 几 个 想法 的 能 力 。 受 此 启发 ， 人 工 智能 研究 者 发 明了 自 编码 器 这 一 架构 。 
自 编码 器 的 任务 ， 就 是 对 大 量 信息 进行 精简 ， 这 些 信息 可 以 是 高 分 辨 率 的 图 














像 或 者 整 部 电影 ， 等 等 ， 最 终 只 留 下 内 容 的 精髓 。 换 名 话说 ， 这 些 神 经 网 络 尝试 


做 到 的 ， 正 是 我 们 在 语文 课 上 被 要 求 做 的 一 种 练习 : 撰写 摘要 。 为 了 测试 摘要 的 


质量 ， 














人 们 也 要 求 自 编码 器 对 自己 生成 的 摘要 进行 解压 缩 ， 设 想 与 这 一 摘要 相关 














的 高 分 辩 率 图 像 或 其 他 原始 数据 是 什么 样子 的 。 


要 做 到 这 一 点 ， 关 键 之 一 就 是 利用 贝 叶 斯 方法 。 对 数据 重组 ， 其 实 就 是 确 
什么 数据 会 得 出 眼前 这 个 摘要 。 这 正 是 贝 叶 斯 公式 的 典型 应 用 ! 我 们 需 
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个 摘要 的 可 能 原因 ， 因 此 我 们 有 
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另外 ,我 们 在 下 一 章 也 会 看 到 人 工 智能 研究 者 如 何 利用 这 一 公式 ， 引 入 不 常 
见 的 摘要 ， 向 机 顺 赋 予 了 创造 性 。 























但 除了 能 用 于 对 编码 后 的 记忆 解码 ， 贝 叶 斯 公式 也 可 以 用 于 确定 适用 于 不 同 
r1 








记忆 的 编码 。 这 就 让 我 们 能 够 只 保留 记忆 中 的 精华 ， 将 它们 压缩 到 只 需 占用 极 小 
的 储存 空间 。 此 外 ， 只 在 储存 空间 中 保留 最 有 可 能 的 几 个 模型 就 能 有 效 地 对 海量 


数据 生成 摘要 ， 这 也 优化 了 储存 空间 的 管理 。 























我 在 这 里 所 说 的 可 能 看 起 来 相当 抽象 ， 而 且 只 跟 人 工 智能 有 关 。 然 而 ， 这 就 
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i 对 一 大 堆 难 以 串联 起 来 的 详尽 事实 ， 即 难以 在 记忆 中 保存 的 事实 时 ， 理 论 

















研究 者 感受 到 的 挫折 的 症结 。 因 此 ， 克 劳 德 香农 也 说 他 在 学 校 里 学 到 的 化 学 
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“(对 他 来 说 ) 似乎 一 直 都 有 点 无 聊 ”:“ 在 我 看 来 ， 孤 立 的 事实 大 多 ,一 般 性 的 原 


则 太 少 。” 











与 之 相反 的 是 ， 关 于 知识 的 贝 叶 斯 主义 方法 会 尝试 找 出 那些 能 够 利用 寥寥 几 














个 主要 原则 概括 大 量 孤 立 事实 的 模型 。 我 们 期 望 通过 上 面 的 贝 叶 斯 公式 ， 只 需 在 
储存 空间 中 保留 那儿 个 一 般 性 原则 ， 冯 
地 解释 了 为 什么 贝 叶 斯 主义 能 够 有 助 于 关于 过 去 的 科学 研究 ， 其 中 包括 历史 、 演 














化 理论 以 及 宇宙 























学 。 如 果 我 们 相信 贝 中 








的 并 非 区 分 对 错 ， 而 是 建立 足够 简单 、 





也 必须 足以 解释 众多 观察 结 


测 仍 未 观察 到 的 可 能 遗留 痕迹 。 


短期 记忆 与 长 期 记忆 





i 足以 推断 出 大 部 分 孤立 的 数据 。 这 就 很 好 








斯 主义 的 话 ， 我 们 就 会 发 现 这 些 学 科 的 目 
有 条 理 而 且 容 易 记 住 的 模型 ， 但 这 些 模型 








一 一 即使 人 们 可 能 会 争辩 这 些 学 科 同 样 允许 我 们 预 








AERA. 肖 研 究 的 是 长 期 记忆 。 其 中 ,信息 被 储存 在 大 脑 皮层 这 一 神 


经 网 络 的 拓扑 结构 之 
络 中 传播 的 各 种 可 能 























1。 问 题 在 于 访问 这 些 数据 可 能 很 困难 ， 需 要 测试 信号 在 网 
式 。 回 忆 一 首 有 名 的 歌曲 的 歌词 一 般 来 说 就 是 这 样 的 情况 。 





在 刚 开 始 回忆 时 ， 我 们 通常 想起 几 个 词 之 后 就 想 不 起 来 了 ， 就 好 像 大 脑 中 电信 号 





的 流动 停滞 了 ， 
终 仍 能 找到 正 而 




















或 者 流向 了 错误 的 方向 一 样 。 然 而 在 重复 这 种 流动 之 后 ， 我 们 最 





的 道路 ， 回 忆 起 整 首 歌 的 歌词 。 























人 们 在 大 型 数据 库 中 搜寻 信息 的 时 候 也 会 碰 到 同样 的 问题 。 给 谷歌 和 其 他 公 
司 带 来 巨大 财富 的 事物 之 一 ， 就 是 为 了 加 速 信息 搜索 而 整合 互联 网 数据 的 方法 。 
但 这 并 不 只 是 信息 整合 的 
信息 的 媒介 进行 取舍 。 某 些 媒介 速度 可 观 但 容量 有 限 ， 比 如 内 存 甚至 是 微 处 理 咒 
中 的 寄存 器 ; 另 一 些 媒介 速度 迟缓 但 容量 极 大 ， 比 如 硬盘 、CERN 使 用 的 磁带 ， 以 





及 DNA 储存 中 。 




















问题 ， 人 们 也 经 常 要 在 储存 容量 和 存储 速度 之 间 对 储存 























另外 ， 还 要 考虑 爱 因 斯 坦 相对 论 的 光速 上 限 。 如 果 信 息 被 储存 在 别 的 地 方 ， 
比如 现在 越 来 越 普遍 的 云 储存 ， 那 么 访问 这 些 数据 就 必然 会 出 现 延迟 。 回 忆 一 下 ， 
光速 大 约 是 105 千 米 每 秒 这 个 数量 级 ， 要 在 瑞士 洛桑 访问 储存 在 远 隔 数 千 千 米 的 欧 
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洲 另 一 端的 数据 ， 就 必须 至 少 花 上 约 109 / 105-2107 秒 ， 也 就 是 几 十 微 秒 。 

对 你 来 说 这 可 能 够 快 了 ， 但 这 种 延迟 引起 数据 多 次 来 回 ， 会 令 用 户 不 耐烦 。 
比如 说 ， 如 果 位 于 美国 纽约 的 服务 器 需要 向 位 于 日 本 东京 的 服务 器 请 求 某 项 信息 ， 
而 东京 的 服务 器 在 此 之 前 又 要 向 位 于 德国 柏林 的 服务 器 发 出 请 求 ， 才 能 让 相关 信 
息 先 从 柏林 传 到 东京 ， 再 从 东京 传 到 纽约 ， 最 后 从 纽约 传 到 位 于 瑞士 洛桑 的 用 户 ， 
这 样 一 来 ， 应 用 程序 必然 反应 迟缓 。 

对 绝 大 部 分 用 户 来 说 ， 这 种 延迟 只 会 带 来 小 小 的 不 快 。 但 在 金融 行业 ， 尤 其 
是 在 高 频 交 易 中 ， 这 样 的 延迟 至 关 紧 要 ， 可 能 意味 着 几 百 万 美元 的 得 失 。 这 就 是 
为 什么 许多 企业 发 现 ， 在 纽约 和 芝加哥 之 间 通 过 微波 而 不 是 光纤 通信 的 话 ， 就 能 
够 多 赚 数 以 百 万 计 的 美元 。 毕 竟 ， 如 果 通 过 光纤 传播 信号 的 话 ， 速 度 就 只 是 光纤 
中 的 光速 ， 比 空气 或 者 真空 中 的 光速 要 稍微 低 一 些 。 通 过 微波 进行 通信 的 话 ， 就 
能 节省 珍贵 的 几 毫 秒 。 

大 容量 储存 媒介 数据 读 取 的 速度 限制 ， 以 及 不 可 避免 的 通信 延迟 ， 两 者 都 促 
使 计算 机 工程 师 使 用 缓存 这 种 手段 。 缓 存 就 是 一 种 靠近 计算 元 件 的 储存 媒介 。 在 
你 的 计算 机 里 ， 内 存 就 是 一 种 缓存 ， 而 更 称 得 上 缓存 的 就 是 所 谓 的 LI1、L2、L3 
缓存 ， 以 及 寄存 器 ， 它 们 包含 的 储存 空间 不 大 ， 但 访问 它们 却 只 需要 微 秒 甚至 纳 
秒 量 级 的 时 间 。 

缓存 这 一 原则 还 有 别 的 应 用 。 比 如 说 ， 当 你 用 Mozilla Firefox, Google 
Chrome、Safari 或 者 其 他 网 页 浏览 器 浏览 网 页 的 时 候 ， 浏 览 器 会 在 计算 机 内 存 中 
缓存 那些 你 反复 下 载 的 信息 。 这 样 的 话 ， 你 就 可 以 直接 访问 这 些 信息 ， 无 须 忍 受 
互联 网 必然 的 通信 延迟 。 

同样 ， 某 些 研究 人 员 认 为 我 们 的 大 脑 处 理 短期 记忆 和 长 期 记忆 的 方法 不 一 样 。 
长 期 记忆 被 铭刻 在 神经 网 络 的 连接 方法 之 中 ， 而 短期 记忆 可 能 主要 由 神经 递 质 控 
制 个 假设 未 经 大 量 实验 证 实 ， 因 此 不 值得 对 它 赋予 很 高 的 置信 度 。 

















































































































递归 神经 网 络 


论 如 何 ， 人 工 神 经 网 络 的 研究 选择 了 第 三 条 道路 : 神经 信号 的 环 路 传播 。 
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包含 这 种 环 路 的 神经 网 络 架构 又 叫 递归 神经 网 络 。 在 处 理 当前 数据 时 ， 这 种 网 络 
能 够 利用 前 一 时 刻 的 部 分 信息 。 对 于 处 理 本 质 上 有 时 序 特 性 的 数据 ， 比 如 书 中 的 
文本 或 者 讲话 中 的 声音 ， 递 归 神 经 网 络 已 经 成 为 最 尖端 的 技术 。 

递归 神经 网 络 用 到 的 技巧 也 包含 在 一 类 更 广泛 的 拥有 内 部 状态 的 算法 之 中 。 
值得 一 提 的 是 ， 这 一 类 算法 包括 之 前 谈 到 的 卡尔 曼 滤 波 器 和 隐 马 尔 可 夫 模 型 。 内 
部 状态 的 任务 就 是 以 精练 的 方式 提取 出 前 一 时 刻 的 信息 ， 用 以 更 好 地 理解 前 一 个 
被 分 析 的 数据 。 然 而 另 一 个 问题 就 是 ， 与 数据 读 取 相 比 ， 内 部 状态 会 以 什么 样 的 
速度 变化 。 

我 有 幸 在 自己 学 习 数 学 和 指导 学 生 学 习 的 过 程 中 都 观察 到 了 一 点 东西 。 第 一 
次 读 一 份 文献 时 〈 比如 说 你 正在 看 的 这 本 书 )， 最 好 不 要 停留 在 细节 上， 以 免 偏离 
阅读 的 主线 。 因 为 如 果 读 得 太 慢 ， 换 种 说 法 ， 就 是 对 于 短期 记忆 这 一 内 部 状态 修 
改 得 太 多 的 话 ， 会 使 思绪 偏离 文献 想 让 我 们 思考 的 东西 。 因 此 ， 有 时 候 先 迅速 浏 
览 一 遍 ， 再 多 花 点 时 间 细 细 阅 读 ， 最 后 再 速 读 一 遍 ， 这 样 可 能 效果 更 好 。 每 一 次 
阅读 都 会 带 来 新 的 东西 ， 因 为 每 一 次 阅读 都 联系 着 短期 记忆 这 一 内 部 状态 的 不 同 
变化 动态 。 

到 这 里 为 止 , 我 们 讨论 的 还 是 对 数据 的 线性 阅读 ， 但 我 们 阅读 或 者 聆听 的 方 
式 并 非 完全 线性 的 。 的 确 ， 当 某 个 句子 非常 星 深 的 时 候 ， 我 们 一 般 会 重读 几 次 ， 
然后 才 继续 线性 阅读 。 同 样 ， 有 时 候 如 果 别 人 一 句 话 还 没 说 完 ， 我 们 就 无 法 理解 。 
自焚 语 、 印 地 语 和 日 语 中 ， 动 词 位 于 名 未 ， 所 以 这 种 情况 尤其 显著 。 同 样 道理 ， 
在 数学 论文 中 ， 计 算 过 程 之 后 通常 会 有 对 计算 的 解释 。 还 有 些 笑话 、 广 告 和 电影 ， 
正 是 结尾 决定 了 它们 的 意义 。 

为 了 同时 利用 过 去 和 未 来 的 数据 理解 现在 ， 人 们 提出 了 另 一 种 神经 网 络 架 构 ， 
那 就 是 所 谓 的 双向 递归 神经 网 络 。 为 了 将 未 来 纳入 其 中 ， 这 些 网 络 必须 延长 得 出 
回应 的 时 间 。 我 们 可 以 打赌 ， 人 类 大 脑 中 也 有 类 似 的 结构 。 这 也 能 解释 我 们 在 经 
过 一 段 延迟 之 后 才 理 解 笑话 的 能 力 ， 甚 至 有 时 候 这 种 延迟 本 身 就 引 人 发 笑 。 

最 后 ， 人 工 智能 领域 的 一 项 最 新 进展 就 是 引入 了 迫使 遗忘 的 神经 元 件 。 那 就 
是 所 谓 的 LSTM 架构 ， 意 思 是 “长 短期 记忆 ”( long-short-term memory ) BR T2 
归 神 经 网 络 中 常见 的 那些 神经 元 环 路 之 外 ，LSTM 还 拥有 另 一 个 额外 的 环 路 ， 它 
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激活 的 时 候 会 强制 让 所 有 神经 元 环 路 中 的 信号 消失 。 这 也 许 就 解释 了 为 什么 我 们 
在 讨论 中 被 打 断 之 后 ， 有 时 候 很 难 回想 起 之 前 讨论 的 话题 。 

目前 ， 在 处 理 本 质 上 有 时 序 特 性 的 数据 方面 ， 比 如 语音 识别 、 自 然 语言 分 析 ， 
等 等 ， LSTM 及 其 变 体 似乎 就 是 最 尖端 的 人 工 智能 方法 。 但 我 承认 自己 不 理解 它 为 
何如 此 成 功 ， 我 也 承认 自己 没有 足够 的 专业 水 平 来 预测 这 些 领 域 未 来 的 前 沿 进 展 。 














应 该 学 什么 ， 应 该 教 什么 ? 








与 人 类 的 记忆 一 样 ， 人 工 神经 网 络 的 记忆 在 可 靠 性 方面 也 没有 保障 ， 无 论 它 
的 编码 是 在 神经 网 络 的 连接 之 中 还 是 在 网 络 环 路 传播 的 数据 之 中 。 我 们 身边 的 计 
算 机 至 少 在 两 项 计算 任务 上 远 远 超越 了 我 们 : 计算 速度 以 及 信息 的 可 靠 储 存 。 我 
敢 打赌 ， 明 天 的 人 工 智能 会 知道 怎么 利用 这 些 实 实在 在 超越 人 类 的 能 力 ， 它 们 可 
能 将 神经 网 络 的 某 些 方面 与 其 他 算法 结合 起 来 ， 这 些 算法 更 可 靠 ， 也 对 更 特殊 的 
任务 进行 了 优化 。 

新 技术 可 能 已 经 改变 了 你 的 大 脑 皮层 。 我 们 沉迷 于 智能 手机 、 谷 歌 和 维基 百 
科 ， 这 似乎 影响 了 我 们 对 记忆 的 管理 。 这 不 一 定 是 坏事 。 上 几 代 人 会 毫 不 犹 殉 地 
赞颂 那些 能 背 出 法 国 戏剧 作家 高 乃依 或 者 法 国 诗人 波 德 莱 尔 的 诗句 、 能 说 出 拿 破 
仑 的 加 网 日 期 或 者 能 默写 出 麦克 斯 韦 方程 组 的 人 。 然 而 ， 许 多 教师 抱怨 ， 成 功 完 
成 学 业 需要 知道 的 东西 太 多 ， 损 害 了 对 背后 概念 的 真正 理解 。 有 些 人 会 说 ， 在 现 
代 社 会 中 ， 技 能 比 知识 更 重要 。 按 照 这 个 逻辑 ， 知 道 怎么 查找 信息 应 该 优 于 单纯 
把 信息 记 住 。 

我 个 人 认为 ， 在 学 校 要 学 习 的 知识 和 技能 都 太 多 了 。 不仅 如 此 ， 这 些 知 识 通 
常 是 作为 绝对 真理 来 传授 的 ， 技 能 则 被 当成 非 此 不 可 的 解答 方法 。 然 而 ， 无 论 是 
纯粹 贝 叶 斯 主义 者 还 是 实用 贝 叶 斯 主义 者 ， 对 他 们 来 说 ,“ 所 有 模型 都 是 错 的 ”。 
但 依 我 看 来 ， 这 还 不 是 问题 最 大 的 地 方 。 

我 认为 ， 知 识 和 技能 的 过 剩 损害 了 对 概念 和 模型 的 理解 ， 尤 其 是 对 理解 这 个 
世界 来 说 最 有 用 、 最 可 信 的 概念 和 模型 。 这 种 教育 往往 忽略 了 模型 可 信 的 原因 及 
其 适用 范围 。 我 的 意见 是 ， 教 授 的 内 容 应 该 大 量 减 少 ， 教 师 应 该 只 教授 那些 违反 
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直觉 并 且 有 教育 意义 的 重要 内 容 。 比 如 说 ， 我 认为 应 该 教授 认 知 偏差 、 演 化 理论 
的 关键 过 程 、 理 论 计算 机 科学 和 道德 功利 主义 ， 同 时 可 以 削减 三 角 学 和 量子 力学 
等 内 容 。 

此 外 ， 贝 叶 斯 公式 似乎 提示 我 们 应 该 通过 例子 来 学 习 ， 而 不 是 直接 记 住 理 
论 一 一 我 们 会 在 接 下 来 的 章节 中 看 到 ， 我 们 的 大 脑 似 乎 偏向 贝 叶 斯 主义 ， 从 具体 
事例 出 发 很 快 就 能 推广 到 一 般 情况 。 因 此 ， 似 乎 只 有 在 获得 了 足够 的 数据 ， 并 使 
这 些 数据 可 以 “轻松 访问 "， 让 我 们 能 够 轻易 估计 贝 叶 斯 公式 中 的 思想 实验 项 之 
后 ， 理 论 的 重要 性 才 会 突然 显现 。 这 样 的 话 ， 似 乎 在 考虑 大 量 例子 ,使 理论 的 效 
用 凸显 眼前 之 后 ， 再 去 学 习 这 些 理论 才 更 合适 。 比 如 说 ， 我 们 应 该 先 以 游戏 、 谜 
题 和 逻辑 悖 论 等 能 吸引 学 生 的 形式 来 引入 数学 ， 之 后 再 向 他 们 解释 这 些 内 容 都 是 
更 普遍 的 理论 的 应 用 事例 一 一 这 正 是 我 在 这 本 书 中 努力 尝试 的 做 法 。 

但 依 我 思 见 ， 要 教授 的 最 重要 的 内 容 还 是 认识 论 ， 还 有 对 于 认识 论 的 应 用 来 
说 不 可 或 缺 的 统计 学 。 当 然 ， 作 为 极端 贝 叶 斯 主义 者 ， 我 尤其 认为 贝 叶 斯 公式 及 
其 大 量 违反 直觉 的 推论 应 该 成 为 教育 的 支柱 之 一 。 

我 认为 是 时 候 放 弃 积 累 公认 正确 的 教条 知识 这 种 做 法 了 ， 应 当 转 而 教授 知识 
是 什么 、 如 何 获得 知识 、 如 何 分 辨 可 信 的 理论 和 不 值得 赋予 置信 和 度 的 理论 。 不 幸 
的 是 ， 在 我 们 这 个 时 代 ， 即 使 是 大 科学 家 也 非常 欠缺 对 认识 论 的 理解 ， 很 多 人 其 
至 不 知道 贝 叶 斯 主义 的 存在 。 
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数学 研究 的 艺术 就 是 找到 包含 一 般 情况 的 所 
有 种 子 的 特例 。 
戴 维 ， 项 尔 伯 特 (1862—1943 ) 
人 生 中 没有 比 当 你 思考 人 生 时 认为 它 很 重要 
这 一 点 更 重要 的 事 。 
FHER. FAZ (1934 一 ) 


第 1 /=# 


睡梦 是 你 的 顾问 


想法 从 何 而 来 ? 














“思想 就 是 漫漫 长 夜 之 中 的 一 道内 电 ， 但 这 道内 电 就 是 一 切 。” 数 学 家 享 
利 . 庞 加 莱 这 样 写 道 。 为 了 描述 这 道内 电 ， 他 讲述 了 一 个 自己 的 伟大 发 现 :“ 在 我 
省 上 踏板 那 一 刻 ， 灵 感 来 了 ， 而 我 之 前 的 思考 似乎 并 不 是 它 的 铺垫 : 我 之 前 用 于 
定义 富 克 斯 函数 的 变换 与 非 欧 几何 中 的 变换 完全 一 致 。” 

庞 加 莱 更 进一步 ， 讲 述 了 另 一 个 发 现 :“ 有 一 天 ,我 在 海边 峭壁 散步 ， 灵 感 来 
了 ， 还 像 往常 那样 简要 、 突 然 ， 而 又 让 人 了 瞬间 确信 : 不 定 三 元 二 次 型 的 算术 变换 
等 同 于 非 欧 几何 中 的 变换 。” 
庞 加 莱 的 这 些 叙 述 在 众多 数学 家 的 亲身 经 历 中 得 到 了 共鸣 。 塞 德里 克 ' 维 拉 
尼 在 他 的 著作 《一 个 定理 的 诞生 》 中 说 ， 他 为 了 填补 一 个 150 页 的 证 明 中 的 巨大 
漏洞 ， 攻 坚 到 凌晨 3 点 后 绝望 地 睡 去 ， 醒 来 时 间 题 的 解答 就 出 现 了 ! 这 些 数学 家 
的 大 脑 似乎 可 以 抛 开 主人 ， 独 立 运转 。 
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就 我 个 人 来 说 ,我 也 有 过 好 几 次 这 样 的 经 历 一 一 即使 我 最 好 的 想法 连 维 拉 尼 
和 庞 加 莱 的 脚 腕 都 够 不 到 ! 我 甚至 敢 以 非常 高 的 置信 和 度 断 言 ， 数 学 家 这 种 让 潜 意 
识 不 断 工作 的 能 力 正 是 他 们 能 轻松 处 理 熟 悉 的 数学 对 象 的 主要 原因 。 两 年 来 ， 贝 
叶 斯 公式 似乎 从 未 离 我 远 去 ， 经 常 在 不 经 意 之 间 开 始 讲述 它 的 秘密 。 

我 只 能 建议 你 追随 庞 加 莱 的 脚步 。 如 果 你 真 的 希望 在 数学 上 有 所 进步 ， 那 么 
我 建议 你 要 对 这 门 学 科 抱 有 激情 ， 达 到 即使 在 睡觉 时 潜意识 都 对 它 紧 抓 不 放 的 程 
度 。 借 用 我 们 在 第 14 章 用 到 的 卡 内 曼 的 心理 学 语言 ， 这 样 做 就 好 像 我 们 脑 中 诞生 
了 系统 三 ， 它 会 指导 系统 一 ， 但 系统 二 却 不 会 觉察 到 这 件 习 

但 这 就 向 心理 学 家 提出 了 一 个 发 人 深思 的 问题 。 这 个 系统 三 是 什么 ?数学 家 
的 大 脑 在 无 意识 中 不 断 推进 思考 时 到 底 发 生 了 什么 ? 做 梦 对 他 们 有 帮助 吗 ” 更 一 
般 地 说 ， 梦 有 什么 用 处 ”这 都 是 些 难题 。 我 绝对 不 会 说 自己 能 告诉 你 完整 的 答案 ， 
但 即使 如 此 ， 我 还 是 想 向 你 展示 诺 贝 尔 生理 学 或 医学 奖 的 获得 者 弗朗西斯 ， 克 里 
区 借 同 格雷 姆 米奇 森 提 出 的 一 个 假设 。 为 什么 是 这 个 假设 ? 因为 它 的 基础 是 一 
个 非常 优雅 的 贝 叶 斯 论证 …… 

但 在 讲述 之 前 ,我 要 先 停 下 来 谈 谈 机 器 目前 能 够 完成 的 创造 性 过 程 。 
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人 工 智 能 的 创新 艺术 


人 工 智能 学 会 作曲 和 绘画 还 是 不 久之 前 的 事情 。 我 们 在 第 16 章 也 简略 提 到 
过 ， 这 种 创造 性 过 程 的 关键 还 是 贝 叶 斯 公式 。 

原因 在 于 ， 在 众多 深度 学 习 模 型 中 ,我们 可 以 在 神经 网 络 中 激活 某 些 所 谓 的 
深度 神经 元 ， 由 此 创造 出 抽象 概念 之 间 的 结合 体 。 其 中 一 些 神经 网 络 就 此 能 够 想 
象 出 哪些 原始 数据 能 激活 那些 被 人 为 激活 的 神经 元 。 也 就 是 说 ,虽然 神经 网 络 通 
常 从 数据 推断 出 能 够 概括 这 些 数据 的 抽象 概念 ， 但 我 们 可 以 要 求 这 些 神经 网 络 在 
已 知 抽象 概念 的 情况 下 猜测 可 能 与 之 有 关 的 数据 。 

然后 ， 选 择 那些 一 般 而 言 没 有 联系 的 抽象 概念 ， 我 们 就 能 让 神经 网 络 创造 出 
一 些 既 不 常见 但 又 相对 可 信 的 数据 。 这 就 是 机 器 的 艺术 生成 过 程 。 我 们 可 以 打赌 ， 
这 种 过 程 至 少 与 我 们 大 脑 中 的 创造 性 过 程 有 几 分 相似 。 
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在 2015 年 ， 谷 歌 利 用 这 种 方法 ， 在 研究 博客 上 发 表 了 人 工 智能 “ 深 梦 ” 
( DeepDream ) 生成 的 一 些 图 像 四。 这 些 图 像 有 种 迷 幻 的 感觉 ， 人 们 在 其 中 能 看 到 
云 打 变 成 了 鱼 ， 树 变 成 了 寺庙 ， 而 树 的 叶子 则 变 成 了 飞鸟 。 更 妙 的 是 ， 你 可 以 要 
求 另 一 个 被 称 为 “ 深 艺 ”( DeepArt ) 的 人 工 智能 用 著名 画家 的 笔触 重新 诠释 你 拍 
的 照片 ,无论 是 几 - 高 、 毕 加 索 还 是 康定 斯 基 都 可 以 。 我 的 Twitter 头像 就 是 “ 深 
艺 ” 花 了 几 秘 生 成 的 免费 劳动 成 果 。 

在 这 些 人 工 智 能 的 创造 性 过 程 中 ， 重 要 步 又 之 一 就 是 神经 网 络 在 给 定 了 数据 
的 抽象 概括 的 情况 下 ， 找 到 可 信 数 据 的 能 力 。 也 就 是 说 ， 神 经 网 络 应 该 能 够 根据 
P[ 数据 | 抽象 概括 ] 这 一 概率 分 布 ， 即 给 定 被 激活 的 抽象 概念 时 数据 出 现 的 概率 ， 
进行 抽样 。 这 样 的 话 ， 根 据 贝 叶 斯 主义 ， 创 造 性 可 以 归结 为 根据 带 有 语 境 的 置信 
度 进行 抽样 。 

但 重要 的 是 ， 抽 样 意味 着 给 出 有 代表 性 的 例子 ， 而 不 是 根据 非常 复杂 的 概率 
分 布 进行 推理 。 在 阐明 推理 并 将 其 变 得 更 易 理 解 的 过 程 中 ， 这 也 许 相 当 有 用 ， 毕 
竞 哪 怕 是 在 数学 中 ， 人 类 的 自然 学 习 方 式 也 似乎 更 倾向 于 依赖 那些 有 代表 性 的 例 
子 ， 而 不 是 形式 化 的 理论 。 我 们 大 脑 中 的 设备 似乎 优化 的 是 从 例子 中 推断 粗略 规 
则 的 能 力 ， 而 不 是 使 神经 网 络 符合 形式 化 理论 的 能 力 。 这 就 解释 了 为 什么 抽样 对 
于 人 类 来 说 不 可 或 缺 。 古 怪 的 是 ， 抽 样 对 于 机 器 来 说 似乎 同样 不 可 或 缺 。 

但 在 讨论 这 一 点 之 前 ， 我 们 必须 先 找到 合适 的 模型 来 表示 数据 与 抽象 概括 之 
间 的 关系 。 人 们 提出 了 几 种 机 器 学 习 架 构 ， 用 于 描述 概率 分 布 以 及 根据 这 些 分 布 
进行 抽样 。 这 些 结构 可 以 分 为 两 类 ( 不同 的 复杂 模型 可 以 适当 地 结合 在 一 起 ) : 贝 
叶 斯 网 络 了 ( Bayesian network ) 和 马尔 可 夫 随 机 场 ( Markov random field )。 我 们 先 
来 看 看 贝 叶 斯 网 络 。 









































































































































隐 含 狄 利克 雷 分 布 


除了 卡尔 曼 滤 波 器 和 隐 马 尔 可 夫 模 型 ， 贝 叶 斯 网 络 的 主要 成 就 之 一 就 是 在 
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它 也 被 称 为 前 馈 模型 (forward model )。 
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2000 年 前 后 提出 的 隐 含 狄 利克 雷 分 布 ( latent Dirichlet allocation， 以 下 简称 LDA )。 
LDA 的 目标 是 将 文档 分 为 不 同 的 类 别 。 计 算 机 可 以 利用 LDA 以 完全 自动 化 的 方 
式 将 你 的 电子 邮件 分 别 放 到 名 为 “私人 ”“ 工 作 ”“ 度 假 ” 和 “垃圾 邮件 ”的 文件 
夹 中 。 更 进一步 的 话 ，LDA 甚至 能 检测 出 不 同类 别 的 组 合 ， 而 且 能 判断 某 份 文档 
的 内 容 一 半 与 工作 有 关 ， 另 一 半 与 度假 有 关 ， 甚 至 判断 出 2/3 属于 私人 内 容 ，1/3 
属于 工作 内 容 。 

要 做 到 这 一 点 ，LDA 利用 了 贝 叶 斯 网 络 中 的 基础 概念 ， 也 就 是 因果 性 的 概念 ， 
它 的 好 处 在 于 符合 我 们 的 直觉 ， 这 也 使 贝 叶 斯 网 络 成 了 相对 易于 解释 的 概率 模型 。 
正 是 得 益 于 贝 叶 斯 网 络 与 直觉 之 间 的 契合 ， 尼 尔 和 伯 杰 才 提 出 可 以 在 司法 领域 使 
用 贝 叶 斯 网 络 ， 就 像 我们 在 第 2 章 中 看 到 的 那样 。 

我 们 现在 回 到 LDA， 它 提出 文档 中 的 所 有 单词 都 可 以 通过 以 下 的 因果 性 过 程 
得 到 CA 17.1) 首先 , 算法 会 为 文档 随机 选 出 某 种 类 别 之 间 的 组 合 ?。 然 后 , 要 确 
定 文档 中 的 每 一 个 单词 ， 算 法 都 会 从 之 前 选 出 的 类 别 组 合 之 中 随机 选 出 一 个 类 别 ， 
最 后 算法 会 根据 之 前 随机 选 出 的 那个 类 别 来 随机 选取 对 应 的 单词 。 





























































































































类 别 组 合 的 分 布 类 单词 的 类 别 














图 17.1 LDA 是 贝 叶 斯 网 络 的 典型 例子 。 它 拥有 因果 性 的 结构 ， 目 的 是 从 观察 数据 中 推断 
出 抽象 概念 。 上 面 的 示意 图 是 对 LDA 的 简化 描述 





LDA 非常 简单 ， 当 然 也 非常 不 正确 。 用 LDA 写 出 的 文档 就 是 一 大 堆 没 头 没 
尾 的 流行 词汇 。 这 本 书 当然 不 是 用 这 种 方法 写 出 来 的 ! 但 “所 有 模型 都 是 错 的 ， 
有 些 模 型 很 有 用 ”。 虽 然 LDA 不 正确 ,但 它 很 有 用 ! 从 互联 网 到 生物 信息 学 都 利 
用 这 项 技术 将 数据 分 门 别 类 。 如 果 说 这 项 技术 非常 有 效 ， 那 是 因为 它 可 以 通过 贝 
叶 斯 推断 来 不 断 改进 自身 。 这 样 的 话 ， 每 处 理 一 份 新 的 文档 ，LDA 都 能 够 分 析 这 
个 文档 来 改进 自身 。 

还 有 更 厉害 的 ! 人 们 无 须 告诉 LDA 自己 认为 待 处 理 的 文档 属于 什么 类 别 一 一 
即使 知道 这 一 点 的 话 对 它 稍微 有 利 。LDA 也 被 认为 是 一 种 非 监督 学 习 算法 : 给 它 


















































中 这 里 的 随机 选取 遵循 的 正 是 狄 利克 雷 分 布 。 
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输入 大 量 文档 ， 无 须 指出 文档 的 类 别 ， 它 仍然 能 够 不 断 优 化 自身 ! 

好 处 还 不 止 于 此 ! LDA 同样 无 须 人 们 给 它 列 出 一 个 希望 考虑 的 类 别 的 既定 列 
表 ， 也 无 须知 道 类 别 的 数量 。 实 际 上 ，LDA 有 一 种 被 称 为 层次 LDA 的 变 体 ， 如 
果 它 发 现 似 乎 出 现 了 一 类 新 的 文档 ， 类 别 数目 就 会 自动 增加 。 我 们 也 说 层次 LDA 
是 一 种 非 参 数 方法 ， 因 为 它 的 复杂 度 可 以 无 限 增长 。 





向 LDA 施 以 援手 的 中 餐馆 





为 了 完成 这 项 壮举 ， 层 次 LDA 与 一 般 的 LDA 一 样 有 着 深刻 的 贝 叶 斯 色彩 。 
具体 来 讲 ， 在 类 别 数目 应 该 如 何 根 据 文档 数量 来 增加 这 一 点 上 ， 安 排 好 一 个 先 验 
的 方法 至 关 重 要 。 这 里 的 先 验 方法 就 是 人 们 所 说 的 中 餐馆 过 程 ( Chinese restaurant 
process )。 
想象 一 下 ， 我 们 身 处 中 餐馆 ， 每 一 个 时 刻 都 有 一 位 新 顾客 到 来 。 这 位 新 顾客 
人 已 有 的 n 一 1 位 顾客 每 人 赋予 一 个 在 1 和 7-1 之 间 的 数字 ， 而 数字 半 对 应 的 就 
一 张 没 有 人 的 桌子 。 然 后 ， 新 顾客 会 在 1 和 之 间 随 机 选取 一 个 数字 ， 并 在 数 
对 应 的 顾客 所 在 的 那 张 人 桌子 就 座 ( 如 果 选 取 的 是 x， 那么 新 顾客 就 会 一 个 人 坐 到 
桌子 那里 )。 在 理论 上 ， 层 次 LDA 假设 每 一 份 新 文档 都 相当 于 一 位 新 顾客 ， 而 
一 个 类 别 就 相当 于 中 餐馆 里 的 一 张 桌子 "。 

在 现实 中 ， 这 个 随机 过 程 对 我 们 来 说 也 许 相 当 有 用 。 如 果 我 们 需要 将 文档 归 
类 ， 那 么 对 第 n 个 文档 以 Ln 的 概率 新 开 一 个 类 别 也 是 个 合理 的 做 法 。 这 样 做 的 
话 ， 我 们 就 可 以 保证 类 别 数目 一 定 不 会 过 分 庞大 。 实 际 上 ， 人 们 可 以 验证 类 别 个 
数 是 数据 数量 的 对 数 ， 这 一 点 就 留 给 擅长 数学 的 读者 了 。 因 此 ， 层 次 LDA 非常 适 
合 大 数据 ! 

层次 LDA 的 惊人 之 处 ， 就 是 执行 这 个 算法 的 计算 机 可 以 就 此 发 明 出 属于 它 自 
己 的 新 概念 。 此 外 ， 在 实践 中 ， 层 次 LDA 发 明 的 那些 类 别 虽 然 切 中 要 害 ， 但 对 人 
类 而 言 却 难以 解释 。 所 以 计算 机 发 现 的 就 是 词汇 中 完全 不 存在 的 概念 。 
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中 ”这 个 餐馆 为 什么 是 中 餐馆 ， 这 还 是 个 六 团 。 但 有 趣 的 是 ， 它 有 一 个 变 体 被 称 为 印度 自助 餐 过 
程 ， 该 变 体 允 许 类 别 之 间 的 组 合 。 





第 17 章 ”睡梦 是 你 的 顾问 | 263 





根据 第 13 章 中 提 到 的 肖 恩 * 卡 罗 尔 的 诗 性 自然 主义 ,我们 必须 承认 这 种 概念 
存在 ， 因 为 它 对 于 计算 机 来 说 的 确 很 有 用 。 从 实用 角度 来 说 ，LDA 重点 指出 的 正 
是 抽象 概念 的 实用 性 并 不 要 求 概念 本 号 对 应 着 物理 中 的 存在 。 为 了 尽 可 能 好 地 解 
释 实 际 中 的 数据 集 ， 发 明 这 些 抽 象 概念 是 必 经 之 路 。 我 们 在 下 一 章 会 更 详细 地 讨 
论 这 个 根本 性 想法 。 

现在 ,我 们 注意 到 从 贝 叶 斯 网 络 和 深度 抽象 概念 出 发 ， 就 能 轻松 地 进行 数据 
抽样 。 这 是 因为 ,根据 贝 叶 斯 网 络 的 定义 ， 生 成 虚构 原始 数据 的 方式 对 应 着 一 个 
精确 的 因果 性 过 程 ( 即使 其 中 也 包含 随机 性 )。 在 LDA 的 情况 中 ， 你 甚至 可 以 轻 
松 要 求 LDA 生成 一 份 一 半 属 于 私人 内 容 、 另 一 半 属 于 工作 内 容 的 文档 。 当 然 ， 如 
果 需 要 生成 一 段 有 意义 的 文字 ，LDA 的 确 不 够 精细 ， 但 它 生 成 的 单词 很 有 可 能 确 
实 将 工作 和 私人 内 容 灶 合 在 了 一 起 。 





























































































































蒙特 卡 罗 模 拟 





虽然 抽样 方法 在 LDA 的 情况 中 似乎 没有 什么 成 果 ， 但 它 在 其 他 框架 中 有 着 
精彩 的 应 用 。 拿 一 盒 颖 衣 针 和 一 大 张 纸 ， 在 纸 上 以 颖 衣 针 长 度 的 4 倍 为 间隔 画 上 
平行 线 ， 然 后 在 纸 上 投 扩大 量 的 颖 衣 针 。 现 在 计算 与 平行 线 相交 的 缝 衣 针 比例 
有 多 少 ， 这 个 比例 大 概 就 是 几何 中 的 基本 常数 t 的 倒数 ， 而 7 就 是 圆 的 周 长 与 半径 
之 比 。 

这 就 是 所 谓 的 布 丰 投 针 实 验 巴 ， 它 能 让 我 们 通过 实验 的 方式 探寻 数学 常数 的 

性 质 一 一 这 跟 尝 试 发 现 宇 宙 性 质 的 科学 实验 相去 甚 远 ! 同样 奇怪 的 是 ， 实 验 中 的 
随机 性 对 于 实验 来 说 至 关 重 要 。 
人 们 也 提出 了 其 他 估计 +t 值 的 类 似 方法 (图 17.2 )。 先 画 出 一 个 半径 为 1/2 的 
到 盘 ， 再 用 边 长 为 1 的 外 接 正 方形 框 住 它 。 圆 盘 的 面积 是 8， 正 方形 的 面积 则 是 
。 然 后 在 正方 形 之 中 ( 均匀 地 ) 随机 投 点 ， 那 么 投入 圆 盘 中 的 点 的 比例 就 应 该 是 
盘面 积 与 正方 形 面积 之 比 ， 也 就 是 8。 这 就 给 出 了 另 一 种 利用 实验 估计 值 的 
方法 : 只 需要 在 正方 形 中 (均匀 地 ) 随机 投 点 ， 然 后 将 投入 圆 盘 的 点 的 比例 乘 以 8 
即 可 。 
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图 17.2 这 两 幅 图 片 展示 了 两 种 通过 蒙特 卡 罗 方 法 对 r 值 进行 近似 的 方法 。 左 图 是 布 丰 投 
针 实验 ， 与 平行 线 相交 的 缝 衣 针 的 比例 大 概 会 是 /rz。 在 右 图 中 ， 正 方形 中 处 于 圆 
盘 内 的 点 的 比例 大 概 会 是 8 
fp. 考 恩 和 德里 克 : 穆 勒 进行 了 这 个 实验 ， 他 们 的 网 名 Physics Girl 和 
Veritasium 可 能 更 为 人 熟知 O, A ARS AE DB AT RARE TRE KE, BR 
M, UP —-RAISR, ATARI A E BRAE, SE fi TE 
不 是 角落 ， 这 会 导致 估计 结果 过 高 。 第 二 天 ， 他 们 改进 了 实验 ， 在 标 靶 背后 画 出 
了 数 个 内 接 于 正方 形 的 圆 稚 。 最 后 他 们 获得 了 c 6.28 这 个 非常 好 的 估计 值 。 
布 丰 、 考 恩 和 穆 勒 的 这 些 实验 属于 更 广泛 的 一 组 实验 类 别 ， 其 中 结果 的 正确 
性 依赖 于 随机 性 是 否 充 足 。 这 类 实验 就 是 所 请 的 蒙特 卡 罗 方 法 ， 它 的 形式 化 框架 
是 在 20 世纪 40 年 代 由 斯 坦 尼 斯 瓦 夫 ' 乌拉 姆 和 约翰 冯 … 庄 伊 曼 提 出 的 ， 他 
们 当时 希望 计算 某 个 牌 类 游戏 的 获胜 概率 。 昌 然 乌 拉 姆 和 冯 … 诺 伊 曼 花 了 相当 长 
的 时 间 进 行 组 合计 算 ， 但 乌拉 姆 还 是 提出 了 问题 : 如 果 大 量 重复 进行 这 个 牌 类 游 
戏 ， 然 后 利用 实验 中 的 获胜 频率 估计 理论 上 的 获胜 概率 ， 这 样 做 会 不 会 更 简单 ? 
冯 诺 伊 曼 立 刻 就 理解 了 乌拉 姆 这 种 想法 的 精妙 之 处 ,然后 仔细 地 在 他 刚 建造 的 
计算 机 ENIAC” 上 编写 了 程序 。 乌 拉 姆 与 汉 … 诺 伊 曼 的 工作 马上 就 在 曼哈顿 计划 
中 得 到 了 应 用 ， 正 是 这 个 计划 促成 了 核武 带 的 诞生 。 
自 此 之 后 ， 蒙 特 卡 罗 模 拟 的 应 用 遍地 开花 ， 占 领 了 众多 领域 ， 无 论 是 量子 物 
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(D ENIAC 即 电 子 数值 积分 计算 机 (Electronic Numerical Integrator and Computer )， 是 世界 上 第 一 
台 通 用 电子 计算 机 。 译 者 注 
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理学 、 空 气动 力 党、 热力学、 统计 物理 学 、 天 体 物理 学 、 测 量 仪器 分 析 、 电 子 工 
程 、 地 质 统计 学 、 能 源 、 环 保 、 机 器 人 人、 电信、 风险 研究 、 信 和 号 处 理 、 气 象 学 、 
系统 发 生 学 〈 对 演化 之 树 的 研究 )、 分 子 生物 学 、 计 算 机 图 形 学 ( 尤其 是 对 光线 轨 
迹 的 计算 )， 还 是 金融 ( 尤其 是 投资 组 合 管理 )。 这 些 模拟 在 研究 系统 关于 初始 状 
态 变 化 的 敏感 度 时 尤其 有 用 。 

这 类 研究 中 最 有 说 服 力 的 例子 可 能 就 是 气象 学 。 因 为 著名 的 蝴蝶 效应 ， 气 象 
测量 的 准确 度 必 然 不 足以 得 到 确定 性 的 预测 。 测 量 中 的 微小 误差 或 者 错过 对 某 个 
小 事件 的 测量 都 可 能 导致 预测 出 现 非常 大 的 偏差 。 气 象 学 家 考虑 到 这 一 点 ， 没 有 
主张 进行 确定 性 的 预测 ， 而 是 选择 了 概率 性 的 预测 。 为 了 得 出 这 些 预测 结果 ， 他 
们 一 般 会 对 初始 条 件 进 行 符合 测量 结果 不 确定 性 的 微小 扰动 ， 以 此 模拟 未 来 的 几 
种 可 能 气象 。 也 就 是 说 ， 他 们 会 根据 一 组 可 信 度 高 的 初始 条 件 进行 蒙特 卡 罗 模 拟 。 
他 们 相信 ， 模 拟 结果 出 现 的 频率 对 应 着 有 效 的 贝 叶 斯 式 预测 。 
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随机 梯度 下 降 法 














在 大 数据 时 代 ， 蒙 特 卡 罗 模 拟 的 另 一 个 应 用 就 是 从 一 大 堆 数据 之 中 抽取 有 代 
表 性 的 样本 。 这 种 简单 的 方法 处 于 目前 机 器 学 习 中 最 重要 的 算法 之 一 的 核心 ， 那 
就 是 随机 梯度 下 降 法 ( stochastic gradient descent， 以 下 简称 SGD )。 

与 其 尝试 让 理论 符合 整个 数据 集 ，SGD 会 从 中 随机 抽出 几 项 数据 ， 然 后 向 这 
几 个 数据 的 解释 迈 出 一 步 。 用 神经 网 络 的 术语 来 说 ， 这 相当 于 稍微 调整 突 触 连接 ， 
使 得 神经 网 络 的 计算 能 更 好 地 贴 合 刚才 随机 选取 的 数据 。 然 后 SGD 会 多 次 重复 这 
步骤 ， 直 到 它 对 随机 抽样 数据 的 解释 足够 正确 。 

人 们 可 能 会 认为 ，SGD 没有 顺 次 处 理 数 据 而 是 按照 随机 的 顺序 处 理 ， 这 是 一 
步 坏 棋 。 但 实际 情况 并 非 如 此 。 从 理论 上 来 说 ,我们 可 以 证 明 SGD 的 性 能 并 不 会 
明显 劣 于 准确 的 梯度 下 降 法 。 在 应 用 方面 ，SGD 在 计算 时 间 上 的 优势 让 它 成 了 人 们 
优先 采用 的 方法 ， 也 让 现在 谷歌 和 Facebook 的 深度 学 习 方 法 成 为 最 尖端 的 算法 。 

但 它 的 妙 处 远 不 止 于 此 。 在 2017 年 ， 曼 特 、 霍 夫 曼 和 布 莱 成 功 将 SGD 重新 
诠释 为 一 种 近似 贝 叶 斯 推断 由， 其 中 SGD 的 每 一 次 随机 数据 抽 选 都 会 让 模型 的 参 
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数 出 现 浮动 。 通 过 调整 与 这 种 浮动 相关 的 参数 ， 这 三 位 研究 者 甚至 能 够 证 明 这 些 
浮动 能 让 算法 适当 地 探索 一 组 可 信 的 模型 ， 而 不 是 只 限制 于 MAP 模型 (最 可 信和 的 
模型 )。 奇怪 的 是 ，SGD 的 这 些 随 机 浮动 可 能 并 不 是 弱点 ， 而 是 一 种 优势 1 

与 我 们 在 第 12 章 中 提 到 的 随机 失 活 方法 一 样 ，SGD 的 这 种 随机 特性 ， 尤 其 是 
它 不 会 收敛 于 MAP 模型 这 一 点 ， 可 能 会 让 它 成 为 对 贝 叶 斯 公式 进行 更 好 的 模拟 时 
必须 考虑 的 方法 ， 尤 其 是 因为 ， 这 样 做 就 能 得 到 某 种 形式 的 平均 化 ， 人 们 看 到 了 
这 一 点 也 许 能 用 于 避免 过 度 拟 合 的 问题 。 因 此 ， 这 一 发 现 大 大 改变 了 我 对 大 脑 中 
使 用 了 某 种 形式 的 SGD 这 个 假说 的 置信 度 一 一 即使 我 情愿 承认 自己 在 这 方面 的 
无 知 ! 

但 从 技术 角度 来 说 ，SGD 的 抽样 确实 非常 简单 ， 只 需 在 已 知 列表 中 随机 选取 
数据 即 可 。 但 在 更 复杂 的 情况 中 ， 抽 样本 身 可 能 就 是 需要 研究 的 领域 。 










































































你 会 怎样 在 正方 形 里 随机 选取 一 个 点 呢 ? 我 们 之 前 也 看 到 了 ， 考 恩 和 穆 勒 在 
让 飞镖 均匀 分 布 在 正方 形 标 靶 这 一 点 上 苦战 了 一 番 。 

约翰 B - 庄 伊 曼 很 快 就 发 现 了 生成 随机 数 的 困难 之 处 。 在 他 之 前 ， 有 些 统 
计 学 家 会 从 对 数 表 之 类 的 复杂 数 表 中 选取 数字 。1939 年 ， 美国 兰 德 公司 (RAND 
Corporation ) 出 版 了 一 本 包含 100 000 个 随机 数 的 书 ， 这 些 数字 都 是 通过 一 个 电子 
轮 盘 的 测量 结果 得 到 的 。 但 这 对 于 冯 : 诺 伊 曼 的 蒙特 卡 罗 模 拟 来 说 远 远 不 够 。 

为 了 更 好 地 将 蒙特 卡 罗 模 拟 自 动 化 ， 冯 : 诺 伊 曼 尝试 了 另 一 种 用 机 器 生成 随 
机 数 的 方式 。 然 而 ， 正 如 冯 … 诺 伊 曼 自 己 所 说 :“ 当 然 ， 任 何 考虑 用 算术 方法 生成 
随机 数 的 人 ， 都 犯 下 了 深重 的 罪过 。” 但 冯 : 诺 伊 曼 同 样 理解 ， 对 于 他 的 模拟 来 
说 ， 真 正 的 随机 性 并 非 必要 。 这 些 数 字 只 需要 拥有 “足够 随机 ”的 性 质 就 可 以 了 。 
伪 随 机 数 就 此 诞生 091, 

利用 这 些 伪 随 机 数 ， 汉 “' 诺 伊 曼 能 够 找到 确定 性 的 算法 ， 可 以 生成 一 连 串 0 
和 1 之 间 独 立 同 分 布 的 伪 随 机 数 。 这 些 随机 数 正 是 所 有 根据 概率 分 布 的 抽样 的 基 
石 。 比 如 说 ， 选 取 0 和 1 之 间 的 两 个 (近似 独立 的 ) 伪 随 机 数 ， 那 么 你 就 得 到 了 







































































第 17 章 ”睡梦 是 你 的 顾问 | 267 


正方 形 中 均匀 分 布 的 伪 随 机 点 的 坐标 。 我 们 终于 做 到 了 ! 
但 我 们 现在 来 考虑 更 困难 的 问题 。 怎 样 才能 得 到 在 正方 形 内 接 圆 中 均匀 分 布 
的 随机 点 呢 ? 更 一 般 的 分 布 又 如 何 ? 




















六 





重要 性 抽样 








要 在 圆 中 以 伪 随 机 的 方式 抽取 一 点 ， 其 实 有 一 种 简单 得 惊人 的 方法 。 先 以 伪 
随机 的 方式 从 正方 形 中 均匀 选取 一 点 ， 如 果 它 在 圆 外 ， 那 就 忽略 它 并 重新 选取 ， 
否则 就 接受 这 个 点 。 我 们 可 以 证 明 这 样 选取 的 点 在 圆 内 是 均匀 分 布 的 ! 

这 个 例子 实际 上 是 一 个 应 用 更 广泛 的 方法 的 特例 ， 那 就 是 重要 性 抽样 
( importance sampling )。 重 要 性 抽样 能 让 我 们 借助 已 经 知道 如 何 抽样 的 参考 分 布 对 
目标 分 布 进行 加 权 抽样 。 我 们 在 借助 对 正方 形 的 抽样 完成 对 圆 的 抽样 时 正 是 这 样 
做 的 。 

更 一 般 来 说 ， 要 根据 目标 分 布 进行 抽样 的 话 ， 就 要 先 根据 参考 分 布 进行 抽样 ， 
然后 我 们 对 抽样 点 赋予 一 个 重要 度 ， 与 这 个 点 在 目标 分 布 中 被 抽 选 到 的 概率 成 正 
比 。 在 圆 的 例子 中 ， 这 个 重要 度 要 么 是 0 ( 如果 抽样 点 处 于 圆 外 )， 要 么 是 1 (如 
果 抽 样 点 处 于 圆 内 ) 当然 ， 如 果 向 抽样 点 赋予 的 重要 度 为 0 的 话 ， 最 终 就 相当 于 
这 个 点 被 忽略 。 

在 不 知道 某 个 随机 变量 的 具体 分 布 ， 但 能 够 计算 该 变量 的 两 个 取 值 的 概率 比 
值 的 情况 下 ， 重 要 性 抽样 就 尤其 有 用 。 圆 的 例子 正 是 如 此 ， 我 们 不 知道 某 个 点 处 
于 圆 内 的 概率 ( 更 准确 地 说 是 概率 密度 )， 但 我 们 知道 这 一 概率 与 圆 内 其 他 任何 一 
点 的 概率 都 相同 。 许 多 拥有 隐藏 变量 的 模型 也 是 这 种 情况 。 
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重要 性 抽样 能 助 LDA 一 臂 之 力 





我 们 回 到 LDA。 假 设 我 们 在 一 篇 文章 中 读 到 的 单词 集合 为 M， 还 有 哪些 单词 
x 很 有 机 会 出 现在 这 篇 文章 之 中 呢 ? 为 了 回答 这 个 问题 ，LDA 首先 会 尝试 确定 这 
篇 文章 属于 哪个 类 别 ， 然 后 就 此 推出 哪些 单词 可 能 出 现在 这 个 类 别 的 文章 中 。 要 
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做 到 这 一 点 ，LDA 首先 必须 在 给 定单 词 的 情况 下 确定 它 可 能 从 属 的 类 别 C。 因 为 
LDA 认为 类 别 决 定 了 单词 ( 你 可 能 还 记得 ， 这 是 一 个 因果 性 模型 ) 所 以 ， 我 们 必须 
在 给 定 结果 的 情况 下 推断 出 原因 。 因 此 ， 我 们 要 用 到 贝 叶 斯 公式 ，LDA 会 计算 出 : 









































_ P[M|CTP(C] 
P[cIM] = — 
这 个 等 式 的 难点 在 于 分 母 ， 它 也 叫 作 边缘 分 布 或 者 配 分 函数 ， 要 计算 它 就 必须 将 


所 有 可 以 想到 的 能 产 出 给 定 文章 的 单词 集合 M 的 类 别 组 合 综合 起 来 。 但 实际 上 这 
样 的 类 别 组 合 有 无 限 个 ! 你 可 能 还 记得 ， 一 篇 文章 中 可 能 1/3 是 私人 内 容 ，2/3 是 
工作 内 容 。 但 这 些 分 数 其 实 可 以 是 任意 正 数 的 组 合 ， 只 要 它们 的 和 "为 1。 除非 有 
额外 的 假设 ， 和 否则 在 给 定 文章 中 单词 的 情况 下 ， 要 准确 计算 这 篇 文章 根据 LDA 应 
该 属于 某 个 类 别 的 概率 ， 简 直 是 阁 人 说 梦 。 

然而 ， 与 圆 的 例子 一 样 ， 我 们 可 以 计算 两 个 不 同类 别 C, 和 C, 概率 的 比值 ， 
无 须知 道 分 母 是 多 少 。 实 际 上 ， 我 们 有 


P[C|M] _ PIMIC]PIC 
[CM]  P[M|C;]IP[C;] 





























然后 我 们 就 可 以 利用 重要 性 抽样 来 构造 有 代表 性 的 加 权 抽 样 方法 ， 由 此 得 出 极 有 
可 能 包含 给 定 文章 的 类 别 组 合 ， 从 而 导出 其 他 可 能 出 现 的 单词 。 

利用 LDA 来 补 全 文章 可 能 不 算 什 么 大 用 处 ， 但 这 个 问题 的 某 些 变 体 却 关乎 
数 十 亿美 元 的 营业 额 。 在 大 数据 的 时 代 ， 最 有 利 可 图 的 计算 机 问题 之 一 就 是 推荐 
系统 。 人 们 投入 了 数 十 亿美 元 的 资金 ， 就 是 为 了 以 最 好 的 方式 解决 以 下 这 个 问题 : 
给 定 你 的 Facebook、iTunes 或 者 亚马逊 的 历史 数据 ， 向 你 推荐 什么 样 的 文章 、 音 
乐 或 者 产品 才 最 合适 ? 

在 2006 年 10 月 2 日 ， 这 个 问题 格外 出 风头 。 那 天 ， 经营 电 影 与 电视 剧 的 美 
国 流 媒体 企业 网 飞 发 起 了 “网 飞 挑 战 ? 四 。 这 一 挑战 面向 数据 科学 家 ， 内 容 是 给 定 
用 户 此 前 的 所 有 打分 数据 ， 预 测 用 户 会 给 某 些 电影 打 多 少 分 。 更 准确 地 说 ， 网 飞 
拥有 一 个 数据 库 ， 其 中 包含 48 万 名 用 户 向 1.8 万 部 电影 打出 的 总 共 1 亿 个 分 数 。 
其 中 一 部 分 分 数 被 公之于众 ， 挑 战 者 要 做 的 就 是 猜测 剩 下 的 那 部 分 分 数 。 


中 ”准确 的 计算 必须 对 所 有 可 能 的 类 别 组 合 进行 积分 ! 
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这 与 LDA 解决 的 不 是 同一 个 问题 ， 但 我 想 你 不 会 没 注意 到 两 者 的 相似 之 处 。 
然而 ， 对 预测 结果 优化 几 个 百分点 ， 也 许 就 能 将 用 户 的 留存 率 提 高 几 个 百分点 ， 
也 就 会 让 营业 额 提高 几 个 百分点 ， 这 代表 的 可 能 是 上 百 万 甚至 上 亿美 元 ! 

HIR, LDA 并 不 是 “网 飞 挑战 ”中 用 到 的 核心 工具 ， 但 在 那些 解决 这 类 问题 
的 最 优秀 的 工具 之 中 ,我们 也 能 找到 其 他 种 类 的 贝 叶 斯 网 络 。 目 前 性 能 最 好 的 模 
型 似乎 就 是 GAN， 其 核心 思想 就 是 构造 深层 贝 叶 斯 网 络 ， 但 在 中 间 放 入 的 随机 涨 
落 非常 少 ， 甚 至 不 存在 "。 因 此 ， 概 率 的 主要 来 源 就 是 极 深 处 的 隐藏 变量 的 不 确定 
性 。 但 正如 冯 … 诺 伊 曼 的 简单 伪 随 机 数 那 样 ， 这 种 不 确定 性 一 般 符合 某 个 非常 容 
易 抽 样 的 概率 分 布 。。 

但 回 到 “网 飞 挑战 ”的 话 ， 扮 演 决 定性 角色 的 实际 上 是 另 一 个 带 有 隐藏 变量 
的 概率 模型 架构 。 这 个 模型 来 自 物理 学 。 
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在 20 世纪 20 AAC, BE + 伦 奖 和 他 的 学 生 恩 斯 特 : 伊 辛 尝试 理解 相 变 现象 。 
从 许多 方面 来 看 ， 相 变 在 今天 仍 是 大 有 可 为 的 研究 主题 。 与 其 攻坚 最 一 般 的 情况 ， 
伦 欧 和 伊 辛 一 心 研究 铁 磁 相 变 : 在 低温 时 ， 铁 可 以 被 磁化 ， 但 在 高 温 时 这 种 磁化 
的 性 质 就 消失 了 。 

为 了 理解 这 一 现象 的 来 源 ， 伦 欧 和 伊 辛 尝试 寻找 微观 的 解释 。 一 块 铁 的 磁 矩 
是 其 所 有 原子 磁 矩 之 和 ， 它 们 又 被 称 为 自 施 ， 取 值 可 以 是 +1 或 者 -1。 伦 次 和 伊 
辛 假设 ， 相 邻 原 子 之 间 的 自 旋 倾 向 于 保持 同一 方向 。 他 们 描述 这 一 假设 的 方法 就 
是 提出 一 对 同 向 自 旋 的 能 量 是 -1， 而 一 对 反 向 自 旋 的 能 量 则 为 +1。 铁 的 总 能 量 
巨 就 是 所 有 相 邻 自 旋 之 间 局 部 相互 作用 能 量 的 总 和 。 

伦 欧 和 伊 辛 提出 的 问题 就 是 ， 在 给 定 的 温度 了 了 下， 这些 自 旋 是 否 会 倾向 于 保 
持 同 一 方向 。 换 句 话说， 在 温度 了 下， 自 旋 大 体 统一 排列 的 位 形 是 否 比 自 旋 没 有 






































中 ”随机 失 活 的 使 用 正 相 当 于 在 中 间 加 入 随机 涨 落 。 
D 然而 贝 叶 斯 推断 本 身 就 很 困难 。 诀 窍 在 于 构造 另 一 个 神经 网 络 ， 它 的 任务 就 是 辅助 贝 叶 斯 扒 
断 的 计算 ! 
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统一 排列 的 位 形 更 可 能 出 现 ? 

对 于 伦 奖 和 伊 辛 来 说 非常 幸运 的 是 ， 男 一 个 类 似 的 问题 早 在 半 个 世纪 以 前 就 
被 路 德 维 希 ， 玻 尔 效 曼 解决 了 。 玻 尔 效 曼 发 现 ， 在 温度 为 了 的 热力 学 平衡 态 中 ， 
能 量 为 ,的 位 形 i 出 现 的 概率 正比 于 exp(- KE/ T), HIP be HB AIDER EE 
数 。 更 精确 地 说 ， 玻 尔 效 曼 分 布 表 明 ， 位 形 i 出 现 的 概率 是 


. exp(-kE, / T) 
P[iT]= 
exp ( kE, IT) + Dexp( kE, IT) 
jei 





























这 个 方程 的 分 母 就 是 有 名 的 配 分 函数 ， 它 的 计算 几乎 不 可 能 完成 ， 因 为 位 形 的 数 
目 一 般 是 原子 个 数 的 指数 函数 。 因 此 ， 如 果 我 们 取 玻 尔 兹 曼 分 布 的 话 ， 那 么 位 形 i 
的 出 现 频率 会 随 着 能 量 E, 的 上 升 而 指数 下 降 。 关 键 在 于 ,温度 了 越 低 ， 这 个 现象 
越 显著 。 

正 是 这 一 点 解释 了 温度 在 铁 磁 相 变 中 的 作用 。 在 温度 较 低 时 ， 拥 有 高 能 量 的 
位 形 ， 也 就 是 那些 自 旋 没有 对 章 的 位 形 ， 出 现 频率 呈 指 数 下 降 的 速度 很 快 ， 因 此 ， 
更 可 信 的 位 形 就 是 那些 自 旋 方 向 较为 统一 的 位 形 ， 这 就 让 铁 带 有 了 磁性 。 反 过 来 
说 ， 在 温度 较 高 时 ， 如 果 我 们 假设 LE, 远 远 小 于 T7， 那么 exp( 一 kE/7) 这 个 量 就 非 
常 接近 1。 然 而， 自 旋 没 有 对 齐 的 位 形 个 数 是 自 旋 对 齐 的 指数 倍 ， 因 为 如 果 你 ( 独 
立 均 匀 地 ) 随机 选取 自 旋 的 取 值 ， 那 么 它们 几乎 不 可 能 大 体 选取 同一 方向 。 这 样 
的 话 ， 在 高 温 时 ， 自 旋 没 有 对 章 的 位 形 集合 出 现 的 可 能 性 是 自 旋 对 齐 的 位 形 集合 
的 指数 倍 ， 因 此 铁 的 磁性 会 消失 。 

伊 辛 模型 有 几 个 令 人 神往 的 原因 。 首 先 ， 它 是 能 解释 相 变 的 最 简 模 型 之 一 。 
让 次， 理解 伊 辛 模型 需要 用 到 玻 尔 效 曼 分 布 ， 它 将 位 形 的 能 量 盛 与 它 出 现 的 概率 
联系 在 了 一 起 。 最 后 也 是 最 重要 的 就 是 ， 伊 辛 模型 是 马尔 可 夫 随 机 场 的 绝妙 范例 ， 
而 且 马 尔 可 夫 随 机 场 处 于 众多 现代 机 器 学 习 模 型 的 核心 。 
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玻 尔 将 曼 机 


马尔 可 夫 随 机 场 可 以 被 描述 为 众多 以 无 向 边 相 连 的 随机 变量 ， 因 此 它 与 贝 叶 
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斯 网 络 极为 相似 。 然 而 与 由 叶 斯 网 络 不 同 的 是 ， 马 尔 可 夫 随 机 场 中 的 边 并 不 代表 
因果 关系 ， 而 是 代表 变量 之 间 的 某 种 相关 性 ， 与 之 相对 的 就 是 那些 没有 被 连 起 来 
的 变量 ， 它 们 从 直觉 上 来 说 几乎 是 相互 独立 的 。 这 基本 上 就 是 人 们 所 说 的 随机 场 
的 马尔 可 夫 性 质 "。 

马尔 可 夫 随 机 场 有 一 种 特例 尤其 适合 机 器 学 习 ， 它 甚至 是 “网 飞 挑战 ”的 解 
答 中 必 不 可 少 的 组 成 部 分 之 一 。 这 种 特例 叫 受 限 玻 尔 兹 曼 机 (restricted Boltzmann 
machine )。 与 带 有 隐藏 变量 的 贝 叶 斯 网 络 一 样 ， 玻 尔 兹 曼 机 会 将 可 观测 变量 与 隐 
藏 变量 关联 起 来 。 也 就 是 说 ， 受 限 玻 尔 兹 曙 机 就 是 一 个 马尔 可 夫 场 ， 其 中 每 条 边 
都 将 一 个 可 观测 变量 与 一 个 隐藏 变量 连接 起 来 (图 17.3 )。 此 外 ， 与 伊 辛 模型 一 
样 ， 玻 尔 效 曼 机 会 向 每 条 边 赋 予 一 个 衡量 相关 性 的 能 量 ”。 



























































E 17.3 玻 尔 将 曼 机 通过 隐藏 变量 将 可 观测 变量 连接 起 来 。 当 其 中 一 些 可 观测 变量 被 观测 
时 ( 这 里 以 黑色 表示 )， 我 们 就 能 利用 所 有 可 观测 变量 通过 隐藏 变量 达成 的 隐藏 联 
系 来 猜测 未 被 观测 的 可 观测 变量 的 可 能 





受 限 玻 尔 兹 曼 机 在 “网 飞 挑战 ”中 的 应 用 可 以 分 为 两 个 阶段 。 首 先 ， 我们 利 
用 数据 学 习 机 器 的 参数 ， 这 些 参数 就 是 每 条 边 的 相关 性 能 量 方程 ”“。 这 些 参数 一 旦 
确定 ， 玻 尔 兹 曼 机 就 能 利用 玻 尔 兹 曼 分 布 进行 概率 性 预测 ， 从 而 解决 “网 飞 挑战 ” 























(CD ERA- 克利 福 德 定理 ( Hammersley-Clifford Theorem ) 证 明了 马尔 可 夫 性 质 等 价 于 要 求 
概率 密度 可 以 分 解 为 团 (clique) 上 函数 的 乘积 ， 也 就 是 P[X=x]=]]A.(x.)， 其 中 x 是 由 所 
le 























有 x 组 成 的 向 量 ， 其 中 ie ce。 

换 句 话说 ， 这 是 一 个 二 部 图 , 一半 是 可 观测 变量 ， 男 一 半 是 隐藏 变量 。 

我 们 可 以 推广 这 种 位 形 ， 考 虑 对 应 观察 数据 的 一 层 变量 ， 将 其 连接 到 第 一 层 隐 藏 变量 ， 然 后 

同样 将 这 一 层 连 接 到 第 二 层 隐藏 变量 ， 以 此 类 推 。 我 们 得 到 的 就 是 所 谓 的 深度 玻 尔 效 曼 机 。 

D ”我 们 一般 假设 某 条 边 的 能 量 是 两 端的 可 观测 变量 与 隐藏 变量 的 双 线 性 函数 ， 此 外 还 需 确定 这 
个 双 线 性 函数 中 的 系数 。 
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的 问题 。 给 定 已 知 的 可 观测 数据 ， 玻 尔 兹 曼 机 就 可 以 推断 出 隐藏 变量 的 可 能 取 值 ， 
从 而 推断 出 未 被 观测 的 可 观测 变量 的 可 能 取 值 。 
纯粹 贝 叶 斯 主义 者 可 以 轻易 完成 这 种 推 煌 ， 并 由 此 推断 出 未 经 观测 的 可 观测 
变量 所 有 可 能 取 值 的 适当 置信 度 。 但 实用 贝 叶 斯 主义 者 无 法 做 出 这 种 推断 ， 因 为 
这 需要 准确 计算 那个 令 人 生发 的 配 分 函数 。 正 因 如 此 ， 在 很 多 情况 下 ， 实 用 贝 叶 
斯 主义 者 都 必须 满足 于 抽样 ， 他 似乎 只 能 通过 ( 有 代表 性 的 ) 例子 来 进行 推断 。 








































































































MCMC 与 谷歌 的 PageRank 








不 幸 的 是 ， 重 要 性 抽样 通常 无 法 在 合理 的 时 间 内 对 玻 尔 兹 曼 机 进行 合理 的 抽 
样 。 一 般 来 说 ， 如 果 重 要 性 抽样 用 到 的 参考 分 布 与 目标 分 布 差异 太 大 的 话 ( 高 维 
空间 中 经 常 出 现 这 种 情况 m)， 那 么 它 可 能 需要 极 多 次 重复 提 代 才能 抽取 到 对 目标 
分 布 来 说 具有 代表 性 的 事例 。 实 际 上 ， 找 出 迅速 而 且 有 代表 性 的 正确 抽样 方法 是 
一 个 困难 的 研究 领域 。 

奇怪 的 是 ， 为 了 解决 这 个 问题 ， 一 个 通常 很 有 用 的 想法 就 是 将 重复 独立 的 蒙 
特 卡 罗 模 拟 换 成 所 谓 的 马尔 可 夫 链 蒙特 卡 罗 方 法 (简称 MCMC )。 这 些 方法 本 质 
上 就 是 在 可 能 性 组 成 的 集合 中 随机 游 走 。 随 机 游 走 中 的 每 一 步 对 于 目标 分 布 来 说 
绝对 不 具有 代表 性 。 

然而 ， 只 要 对 随机 游 走 中 的 每 次 转移 进行 适当 的 选择 ， 那 就 仍然 有 可 能 保证 
在 步 数 趋向 无 限时 , 访问 可 能 性 集合 中 的 每 一 点 ”的 频率 都 会 趋向 于 这 个 点 在 目标 
分 布 中 的 概率 。 简 单 地 说 ， 在 趋 近 于 无 限时 ， 抽 样 结果 对 于 目标 分 布 来 说 会 具有 
完全 的 代表 性 。 

表面 看 来 ， 你 可 能 会 认为 MCMC 是 个 相当 糟糕 的 想法 , 但 你 错 了 ， 给 谷歌 
带 来 财富 的 算法 正 是 一 个 MCMC 算法 ! 这 个 算法 叫 作 PageRank， 它 是 谷歌 搜索 
引擎 最 早 几 个 版 本 的 核心 。PageRank 的 关键 就 在 于 ， 每 个 网 页 的 重要 性 都 是 根据 
其 他 网 页 赋予 它 的 重要 性 以 及 这 些 网 页 本 身 的 重要 性 来 计算 的 。 因 此 ， 维 基 百 科 






























































































































































中 ”在 连续 分 布 的 情况 中 ， 应 该 考虑 访问 任意 开 集 的 频率 。 
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的 页 面 可 能 会 被 认为 非常 重要 ， 因 为 大 量 其 他 网 页 中 有 指向 这 个 维基 页 面 的 链接 ， 
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AN 


al 


网 


pol 


此 
用 


面 应 该 非常 重要 ， 因 为 很 多 路 径 可 以 引 向 这 些 页 鲁 


定 





中 包括 本 壬 就 很 重要 的 网 页 。 














然而 ， 因 为 每 个 网 页 的 重要 性 依赖 于 其 他 网 页 的 重要 性 ， 所 以 要 计算 某 个 网 
的 重要 性 就 必须 解 出 一 个 复杂 得 令 人 生 旦 的 方程 ， 这 个 方程 的 未 知 数 个 数 等 于 

















页 的 个 数 ! 谷歌 创始 人 拉 里 ， 佩 奇 和 谢 尔 盖 ， 
解决 这 个 问题 。 他 们 的 PageRank 算法 会 想象 出 一 个 虚拟 浏览 者 ， 他 会 在 互联 网 





MAR ETAT RES SEE MCMC 


游荡 ， 每 次 都 在 当前 正在 访问 的 页 面 中 随机 点 击 一 个 链接 。 这 位 浏览 者 之 后 会 











这 种 方式 在 页 面 之 间 穿 梭 。 从 直觉 上 来 说 ， 


我 们 预期 这 位 浏览 者 大 量 访问 的 页 
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我 们 实际 上 可 以 证 明 ， 如 果 互 联网 是 强 连通 的 话 ， 那 么 在 实验 中 浏览 者 到 达 给 









































页 面 的 频率 会 精确 收敛 到 我 们 之 前 想 要 计算 的 页 对 





重要 程度 "。 因 此 , 在 进行 足够 














长 时 间 的 模拟 之 后 ， 实 验 中 得 到 的 频率 就 是 页 面 重 要 程度 的 一 个 很 好 的 近似 外 。 
正 是 这 个 绝妙 的 原则 让 佩 奇 和 布 林 创立 了 地 球 上 最 强大 的 企业 之 一 ， 别 无 他 物 ! 





梅 特 罗 波 利 斯 - 黑 廷 斯 抽样 
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梅 特 罗 波 利 








虽说 PageRank 是 组 织 互联 网 网 页 的 绝 佳 方法 ， 但 它 似乎 无 法 变 为 可 以 对 受 限 

















尔 兹 曼 机 的 概率 分 布 进 行 抽样 的 形式 。 男 









































梅 特 罗 波 利 斯 - 黑 廷 斯 抽样 会 带领 我 们 漫步 ， 


5 


波 





隐藏 变量 的 合理 取 值 组 成 的 空间 。 








一 种 方法 可 以 做 到 这 一 点 ， 它 被 称 为 
斯 — 黑 廷 斯 抽样 ( Metropolis-Hasting sampling )。 与 PageRank 一 样 ， 


但 现在 漫步 的 地 点 是 由 可 观测 变量 





在 随机 漫步 的 每 个 时 刻 ， 我 们 都 要 考虑 随机 的 下 一 步 ， 如 果 它 会 将 我 们 引 向 
概率 太 小 的 状态 的 话 ， 那 么 我 们 可 以 拒绝 执行 。 更 准确 地 说 ， 令 当前 状态 为 i， 假 
设 随机 的 下 一 步 会 将 我 们 引 向 状态 j。 为 了 决定 应 该 接受 还 是 拒绝 这 一 步 ， 梅 特 罗 
利 斯 - 黑 廷 斯 抽样 告诉 我 们 应 该 先 计算 接受 率 4。 我 们 将 A 定义 为 : 























P[j] 也 [转移 步 又 


(i j)li] 








Phi] P|[ 转 移 步 又 
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收敛 的 概率 为 1， 也 就 是 几乎 必然 收敛 。 


G => |J 
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从 直觉 上 来 说 ， 如 果 状 态 j 比 状态 i 更 可 能 发 生 ， 而 且 从 i 到 j 这 一 步 很 可 能 
可 逆 ， 即 反 过 来 的 那 一 步 (也 就 是 从 j Ui) 在 随机 漫步 中 被 选择 的 概率 与 原来 相 
比 不 算 太 小 的 话 ， 那 么 从 i 到 j 这 一 步 的 接受 率 就 会 取 较 大 的 值 。 如 果 接 受 率 4 大 
于 1， 那 么 梅 特 罗 波 利 斯 - 黑 廷 斯 抽样 就 会 告诉 我 们 要 采纳 这 一 步 。 否 则 ， 我 们 就 
必须 进行 随机 选择 ， 选 择 接受 的 概率 是 接受 率 4。 

关键 在 于 ， 如 果 每 一 步 与 反 过 来 的 那 一 步 都 拥有 相同 的 概率 ， 那 么 无 须 
利用 配 分 函数 就 能 将 4 计算 出 来 。 在 玻 尔 兹 曼 分 布 的 情况 中 ,我 们 有 PU 
PP[ 让 =exp(kE,/T)/exp(KE,/T)=exp(K(B,~-B)/T)。 昌 然 没 有 使 用 配 分 函数 ， 但 在 某 些 合 
理 的 假设 下 "， 在 足够 长 的 时 间 之 后 ， 这 一 随机 漫步 就 能 导出 目标 分 布 的 一 个 有 代 
表 性 的 抽样 ， 跟 PageRank 的 情况 一 样 。 

更 进一步 ， 我 们 可 以 在 抽样 中 加 入 可 观测 变量 的 观测 值 的 条 件 ， 只 需 在 漫步 
时 禁止 改变 这 些 变量 的 值 即 可 。 这 样 ， 在 已 知已 观测 变量 的 情况 下 ， 我 们 就 得 到 
了 对 未 观察 变量 具有 代表 性 的 抽样 。 

对 实用 贝 叶 斯 主义 者 来 说 ， 梅 特 罗 波 利 斯 - 黑 廷 斯 抽样 可 以 变化 为 各 种 有 用 
的 形式 ， 能 用 于 那些 配 分 函数 的 正确 估计 需 时 过 长 的 概率 分 布 。 一 方面 ， 所 谓 的 
自 适应 变 体能 够 在 抽样 过 程 中 优化 随机 转移 的 性 质 ; 另 一 方面 ， 也 存在 近似 形式 
的 梅 特 罗 波 利 斯 - 黑 廷 斯 抽样 ， 即 使 状态 i 和 jj 的 概率 之 比 PUIPUI 无 法 直接 计 
算 ， 也 能 进行 抽样 。 复 杂 数 据 的 生成 模型 通常 都 属于 这 种 情况 ， 我 们 在 第 15 章 结 
尾 谈 到 的 宇宙 模拟 就 是 这 样 的 例子 。 这 样 的 话 ， 我 们 可 以 尝试 将 这 些 概率 替换 为 
对 状态 i 和 的 效果 度量 perf(i) 和 perfj)， 条 件 是 我 们 必须 预期 这 些 数量 与 处 于 相 
应 状态 的 概率 之 间 有 着 充分 的 相关 性 。 




































































































































































吉 布 斯 抽样 





然而 在 玻 尔 兹 曼 机 的 情况 中 ， 另 一 种 MCMC 抽样 才 是 最 常用 的 方法 。 这 种 方 
法 叫 作 吉 布 斯 抽样 (Gibbs sampling )， 它 依赖 于 受 限 玻 尔 效 曼 机 的 一 个 特殊 性 质 。 
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重要 的 假设 是 这 一 漫步 将 我 们 导向 任意 状态 的 概率 都 不 为 0。 
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你 大 概 还 记得 ， 在 受 限 玻 尔 兹 曼 机 中 ， 可 观测 变量 只 与 隐藏 变量 有 联系 ， 反 之 亦 
然 。 所 以 ， 可 观测 变量 之 间 没 有 直接 联系 ， 隐 藏 变量 也 是 如 此 "s 

吉 布 斯 抽样 的 主要 思想 ， 就 是 对 可 观测 变量 和 隐藏 变量 分 别 交 替 抽样 。 重 点 
在 于 ， 如 果 给 定 可 观测 变量 的 值 ， 那 么 受 限 玻 尔 效 曼 机 的 总 能 量 就 是 隐 
一 个 线性 函数 ”。 因 此 ， 某 个 隐藏 变量 对 于 总 能 量 的 贡献 
值 。 这 样 的 话 ， 给 定 已 观测 的 变量 ， 每 一 个 隐藏 变 量 都 可 以 进行 独立 抽样 ”! 这 就 
大 大 简化 了 抽样 过 程 。 

给 定 某 些 被 观测 的 可 观测 变量 ， 吉 布 斯 抽样 首先 会 向 那些 未 被 观测 的 可 观测 
变量 赋予 任意 的 值 ， 这 就 是 任意 选择 的 随机 漫步 起 点 。 然 后 ， 吉 布 斯 抽样 会 在 给 
定 可 观测 变量 的 条 件 下 对 所 有 隐藏 变量 进行 抽样 ， 接 下 来 根据 隐藏 变量 的 抽样 值 
对 未 被 观测 的 可 观测 变量 进行 抽样 。 这 样 ， 我 们 就 在 可 观测 变量 的 空间 中 进行 了 
一 步 随 机 转移 。 

然后 吉 布 斯 抽样 会 重复 这 样 的 随机 转移 。 经 过 足够 长 的 时 间 之 后 ， 这 样 的 计 
算 能 让 我 们 得 到 在 给 定 某 些 可 观测 变量 的 实际 观测 值 的 条 件 下 ， 对 未 被 观测 的 可 
观测 变量 的 可 能 取 值 的 具有 代表 性 的 抽样 结果 。 
在 我 们 看 到 的 所 有 MCMC 的 情况 中 ， 无 论 是 PageRank、 梅 特 罗 波 利 斯 - 黑 
廷 斯 抽样 还 是 吉 布 斯 抽样 ， 关 键 都 在 于 抽样 过 程 需要 持续 足够 长 的 时 间 。 和 否则 ， 
抽样 得 到 的 数据 就 会 在 很 大 程度 上 取决 于 随机 漫步 的 起 点 ， 而 在 我 们 希望 抽样 的 
分 布 中 ， 这 些 起 点 完全 不 具备 代表 性 。 

更 糟糕 的 是 ， 通 常 绝 大 部 分 可 想象 的 数据 实际 上 出 现 的 概率 可 以 忽略 不 计 。 
也 就 是 说 ， 在 庞大 的 数据 集合 中 ， 只 有 一 小 部 分 数据 的 置信 和 度 是 不 可 忽略 的 。 可 
信 理 论 的 集合 一 般 来 说 也 是 如 此 ， 它 们 在 充满 荒诞 理论 的 极 高 维 海洋 中 组 成 了 守 
寥 几 个 小 岛 。 因 此 ， 如 果 MCMC 没有 落 到 这 些 稀 有 的 可 靠 数 据 或 者 理论 上 的 话 ， 
那么 它 就 不 可 能 意识 到 ， 目 前 为 止 探索 过 的 数据 和 理论 都 并 不 可 靠 。 你 可 能 还 记 
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(D 这 也 能 自然 推广 到 深度 玻 尔 效 曼 机 的 情况 。 

© 要 做 到 这 一 点 ,需要 假设 总 能 量 Ev, A) 是 可 观测 变量 v 和 隐藏 变量 h 的 双 线 性 形式 。 

© 也 就 是 说 ， 在 给 定 可 观测 变量 取 值 的 条 件 下 ， 隐 藏 变量 互相 独立 。 这 其 实 是 隐藏 变量 组 成 的 
集合 在 马尔 可 夫 随 机 场 对 应 的 图 中 是 一 个 独立 集 这 一 事实 的 直接 推论 。 
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得 ，MCMC 只 知道 某 个 已 探索 数据 相对 于 其 他 已 探索 数据 的 置信 度 。 这 样 一 来 ， 如 果 
未 曾 探索 过 任何 真正 可 靠 的 数据 的 话 ， 那 么 所 有 已 探索 过 的 数据 都 会 看 起 来 很 可 靠 ! 

一 言 以 项 之 , MCMC 抽样 的 中 间 结 果 相 对 于 MCMC 尝试 抽样 的 概率 分 布 来 
说 并 不 具有 代表 性 。 此 外 ， 我 们 同样 不 可 能 计算 或 者 估计 出 利用 MCMC 得 到 的 抽 
样 结果 是 否 有 代表 性 。 虽 说 在 趋向 无 穷 的 时 候 MCMC 的 确 有 效 , 但 它 有 可 能 需要 























很 长 时 间 才 能 达到 这 个 目标 ， 而 且 对 此 没有 任何 保证 。 
































尽管 如 此 , MCMC 能 够 以 其 他 方法 无 法 企及 的 效率 进行 抽样 ， 它 凭 此 成 了 实 





用 贝 叶 斯 主义 者 必 不 可 少 的 工具 之 一 。 


MCMC 与 认 知 偏差 





正 因 为 MCMC 如 此 复杂 ， 我 省 略 了 对 它 的 详细 描述 。 虽 然 我 还 是 花 了 些 时 


间 来 解释 它 的 原则 和 用 途 ， 但 这 不 是 为 了 让 你 能 在 实践 中 应 用 这 一 方法 ， 而 主要 
是 为 了 向 你 解释 为 什么 达尔 文 式 演化 可 能 在 种 种 限制 之 下 让 我 们 的 大 脑 成 了 进行 








MCMC 计算 的 机 器 ， 以 及 为 什么 理解 这 一 点 至 关 重 要 。 





心理 学 家 丹尼尔 . 卡 内 曼 提 到 过 ， 在 以 色 列 多 次 遭受 公共 汽车 疏 怖 袭击 的 那 
4t 











段 时 期 ， 他 在 开车 的 时 候 都 会 尽量 远离 视线 中 的 任何 公共 汽车 ， 而 他 对 此 感到 很 
羞愧 。 作 为 一 名 合格 的 统计 学 家 ， 他 知道 死 于 驾驶 事故 的 概率 仍 远 远大 于 目击 公 











共 汽 车 遭 到 灵 怖 袭击 的 概率 。 恐 怖 主义 导致 的 死亡 人 数 与 交通 事故 的 死亡 人 数 比 


起 来 可 以 忽略 不 计 。 但 即使 有 如 卡 内 曼 这 样 知 晓 相关 信息 





大 脑 ， 也 难免 高 佑 恐怖 主义 的 危险 性 。 








又 受过 良好 教育 的 人 的 














这 种 认 知 俩 差 就 是 卡 内 曼 所 谓 的 可 得 性 俩 差 (availability bias )。 我 们 通常 会 
赋予 脑海 中 出 现 的 第 一 个 想法 过 高 的 重要 性 。 如 果 我 让 你 想象 那 位 31 岁 的 反 核 活 














动人 士 琳 达 的 形象 ， 你 的 脑海 中 可 能 很 快 就 会 出 现 某 个 








形象 ， 而 且 你 会 对 这 个 形 


象 过 度 拟 合 。 这 种 偏差 似乎 揭示 了 我 们 的 大 脑 也 用 到 了 MCMC。 如 果 没 有 经 过 足 














够 长 时 间 的 思考 ， 那 么 MCMC 就 会 严重 地 受到 起 点 的 影 
常 弟 让 灵 怖 主义 成 为 思考 灾难 性 情景 的 起 点 。 














自 一 一 而 媒体 的 狂 秦 滥 炸 








这 种 偏差 可 能 看 起 来 相对 明显 ， 一 部 分 原因 就 是 当 我 们 受到 可 得 性 偏差 的 困 
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扰 时 ， 我 们 不 难 意识 到 自己 正在 思考 什么 。 人 然而， 我 们 无 法 意识 到 在 大 脑 中 穿梭 
的 众多 信号 ， 但 这 不 会 阻止 MCMC 将 这 些 信号 作为 它 在 思想 世界 中 随机 漫步 的 出 
发 点 。 因 此 ， 在 不 知情 的 状态 下 ， 我 们 的 思考 被 身 处 的 场景 高 度 影响 ， 其 程度 令 
人 难以 置信 。 这 就 是 启动 效应 ( priming effect )。 

有 关 这 个 课题 最 惊人 的 实验 之 一 ， 就 是 加 里 : 韦 尔 斯 和 理 查 德 . 佩 蒂 在 1980 
年 进行 的 实验 外。 韦 尔 斯 和 佩 蒂 邀请 了 72 位 学 生 在 多 种 使 用 场景 中 测试 某 种 耳 
机 。 他 们 要 用 这 种 耳机 聆听 一 段 有 关 学 费 从 587 美元 涨 到 750 美元 的 社论 ， 其 中 
24 名 学 生 保 持 头 部 不 动 ， 另 外 24 名 学 生 一 边 听 一 边 点 头 〈 就 像 在 表达 肯定 )， 其 
R 24 PARENT RÉ CHERE )。 测 试 结束 之 后 ， 人 研究 人 员 在 关 
于 耳机 质量 的 问卷 的 最 后 一 道 问题 中 询问 学 生 ， 他 们 认为 应 该 收 多 少 学 费 。 结 
令 人 目瞪口呆 。 那 些 摇头 的 学 生 的 答案 平均 值 是 467 美元 ， 头 部 不 动 的 学 生 的 答 
案 平 均值 是 582 美元 ， 而 点 头 的 学 生 的 答案 平均 值 则 达到 了 646 美元 。 简 直 难 以 
置信 ! 我 们 的 判断 被 行为 所 决定 ， 而 我 们 却 丝毫 没有 觉察 到 这 一 点 。 

关于 我 们 的 MCMSC 式 思考 对 起 点 的 依赖 性 ， 另 一 个 惊人 的 例子 就 是 锚 定 效 
应 (anchoring effect )。 卡 内 曼 和 特 沃 斯 基 进 行 了 一 项 令 人 不 安 的 实验 来 揭示 这 种 
效应 ， 他 们 首先 在 被 试 面前 随机 选择 一 个 数字 ， 要 么 是 10， 要 么 是 65。 假 设 选 
到 的 是 10， 那 么 卡 内 曼 和 特 沃 斯 基 就 会 询问 被 试 ， 世 界 上 位 于 非洲 的 国家 比例 是 
否 超过 10% ; 如 果 选 到 的 是 65， 那 么 他 们 问 的 还 是 同一 个 问题 ， 但 会 将 数字 换 成 
65%。 接 下 来 他 们 要 求 被 试 估计 非洲 国家 所 占 的 比例 。 令 人 惊异 的 是 ， 当 随机 选 
择 的 数字 是 10 时 ， 被 试 对 这 个 问题 的 答案 平均 值 是 25% ; 而 当选 择 的 数字 是 65 
时 ， 答案 的 平均 值 则 是 43% ! 这 个 实验 的 变 体 证 明了 ， 即 使 研究 人 员 给 出 的 数字 
低 得 离谱 或 者 高 得 离谱 ， 这 一 出 人 意料 的 效应 仍然 存在 NL 

在 能 阐明 我 们 的 思考 方式 会 持续 使 用 MCMC 的 众多 例子 中 ， 我 选取 的 第 三 个 
例子 就 是 损失 厌恶 (loss aversion )。 卡 内 曼 和 特 沃 斯 基 用 展望 理论 描述 了 这 种 厌 
恶 ， 它 能 够 同时 解释 大 量 认 知 偏差 。 这 个 理论 的 基础 就 是 我 们 的 偏好 总 是 强烈 受 
参照 物 影响 的 事实 。 相 对 于 这 一 参照 物 而 言 的 收益 是 好 事 ， 但 相对 的 损失 却 令 人 
有 灾难 的 感觉 。 这 就 解释 了 为 什么 在 奥运 会 颁奖 时 银牌 得 主 往 往 一 脸 愁 容 ， 而 铜 
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TRA SEA ARE 

MCMC 本 身 并 不 是 问题 ， 问 题 在 于 MCMSC 的 有 效 性 只 有 在 经 过 大 量 随机 转 
移 步 又 之 后 才 会 凸显 出 来 。 不 巧 的 是 ，MCMC 一 开始 提出 的 想法 有 可 能 全 部 非 
常 不 可 靠 ， 与 无 塌 的 思想 空间 中 那些 屈指 可 数 的 可 靠 想法 相 比 就 更 是 如 此 。 如 果 
MCMC 的 抽样 没有 得 到 任何 可 靠 的 想法 ,那么 它 得 出 的 结论 就 会 大 错 特 错 。 

一 旦 知道 我 们 的 大 脑 可 能 应 用 了 MCMC， 那 我 们 就 绝对 必须 认识 到 自己 无 知 
的 范围 。 此 外 ,我们 也 绝对 必须 花 时 间 一 一 比 现实 中 一 般 情况 更 长 的 时 间 一 一 去 
思考 。 因 此 ， 长 时 间 竖 想 和 睡眠 的 好 处 ， 有 一 部 分 可 能 就 在 于 能 够 延长 MCMC 的 
计算 。 



























































对 比 散 度 与 梦 


到 这 里 为 止 ， 我 们 看 到 的 东西 不 过 是 克 里 克 和 米奇 森 提出 的 解释 之 中 的 一 部 
分 。 对 这 两 位 研究 者 来 说 ， 梦 的 作用 尤其 集中 在 另 一 个 用 于 机 器 学 习 的 算法 ， 它 
叫 作对 比 散 度 算法 (contrastive divergence )。 这 个 算法 的 目标 是 ， 给 定 某 个 带 有 隐 
藏 变量 的 模型 ， 计 算 其 MAP 参数 。 这 个 算法 尤其 可 以 用 在 只 知道 数据 之 间 概 率 的 
比值 这 种 情况 中 ， 就 像 LDA 的 贝 叶 斯 推断 或 者 玻 尔 兹 曼 机 那样 。 

我 这 里 就 省 去 计算 的 步骤 了 。 最 重要 的 等 式 是 : 


d log P[0| D] = 9e log P[6] + 8s log p(D|9) — Exo [do log p(x10)] 















































也 就 是 说 ， 要 知道 如 何 调整 参数 0 才能 得 到 最 可 靠 的 理论 ， 我 们 就 必须 理解 其 中 
三 项 。 第 一 项 是 9 的 变化 对 先 验 置信 和 度 的 影响 ; 第 二 项 是 0 的 变化 对 模型 未 归 一 
化 的 概率 产生 的 影响 (一般 在 玻 尔 兹 曼 分 布 中 对 应 的 就 是 exp( 一 kB/7) 这 一 项 ); 
而 第 三 项 ， 也 就 是 最 后 一 项 ， 是 0 的 变化 对 刀 的 替代 理论 x 的 未 归 一 化 概率 的 
影响 。 


对 大 量 模型 ， 尤 其 是 玻 尔 效 曼 机 来 说 ， 前 两 项 非常 容易 计算 。 然 而 ， 最 后 一 






































D 这 种 锚 定 效应 的 另 一 种 可 能 解释 ( 同样 是 贝 叶 斯 的 角度 ! ) 是 卡尔 * 弗 里 斯 顿 提出 的 大 脑 皮层 
预期 与 修正 机 制 。 根 据 这 一 理论 ， 我 们 的 大 脑 无 时 无 刻 不 在 做 出 预测 ,但 只 有 在 观察 结果 与 
预测 矛盾 时 才 会 做 出 反应 ， 就 此 开始 学 习 的 过 程 。 这 也 符合 香农 提出 的 通信 优化 方式 。 
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项 一 般 来 说 需要 ( 用 时 较 长 的 ) 重要 性 抽样 。 但 关键 之 处 在 于 ， 最 后 一 项 并 不 依 
赖 于 数据 ! 我 们 无 须 观察 世界 就 能 把 它 计 算出 来 ! 只 需要 做 梦 就 能 确定 它 的 值 。 
对 于 克 里 克 和 米奇 森 来 说 ， 梦 的 作用 也 许 正 是 这 一 点 。 梦 能 够 用 来 计算 MAP 
模型 ， 方 法 就 是 通过 抽样 来 计算 大 脑 中 参数 的 变化 会 如 何 影 响 观 察 数 据 会 出 现 蔡 
代 选 择 的 未 归 一 化 概率 。 
这 就 是 我 们 应 当 多 花 时 间 思 考 的 一 个 理由 。 














哲学 被 写 进 了 这 本 浩瀚 的 书 中 ， 它 一 直 在 
眼前 打开 着 ( 这 本 书 就 是 宇宙 )， 但 如 果 不 
首先 花 时 间 去 理解 撰写 这 本 书 用 到 的 语言 和 
字母 ， 那 就 不 可 能 理解 它 。 这 本 书 用 数学 写 
就 ， 其 中 的 字母 就 是 三 角形 、 圆 形 ， 以 及 其 
他 几何 图 形 ， 假 如 缺少 它们 的 话 ， 人 类 就 无 
法 凭借 自己 的 力量 抓 住 任何 一 个 单词 ;假如 
没有 这 些 手 段 的 话 ， 我 们 就 要 面临 在 黑暗 迷 
官 中 游荡 的 危险 。 

伽利略 (1564 一 1642 ) 


s18z 
抽象 方法 超出 常理 的 有 效 性 





2016 £3 H 10 H, AlphaGo 登 上 了 各 大 头条 。 谷歌 研发 的 人 工 智 能 出 乎 大 众 
意料 ， 打 败 了 围棋 界 公 认 的 最 优秀 棋 手 之 一 李 世 石 。 

围棋 与 国际 象棋 一 样 ， 也 是 一 种 两 人 游戏 。 然 而 一 直 以 来 ,围棋 之 于 国际 象 
棋 ， 就 像 国际 象棋 之 于 井 字 棋 。 围 棋 更 复杂 ， 组 合 更 多 ， 也 更 难以 预计 。 最 优秀 
的 围棋 棋 手 有 时 候 甚 至 会 依靠 某 种 直觉 ， 但 他 们 也 无 法 解释 这 些 直 党 的 来 源 一 一 
有 些 人 其 至 断言 ， 这 是 一 种 超越 机 器 能 力 的 人 类 智能 。 长 期 以 来 ， 最 优秀 的 算法 
也 只 能 勉强 追 上 中 等 水 平 的 围棋 棋 手 。 

但 在 数 年 之 间 ， 某 种 机 器 学 习 的 模型 接连 取得 了 不 同 几 响 的 成 绩 。 物 体 识别 、 
人 脸 识 别 、 光 学 字符 识别 、 自 然 语 言 处 理 、 自 动 化 翻译 以 及 推荐 系统 从 前 都 是 机 
器 无 法 解决 的 问题 ， 但 突然 之 间 ， 它 们 全 部 都 被 深度 学 习 解 决 了 。 硅 谷 的 所 有 投 
资 者 挂 在 嘴 边 的 就 只 剩 下 这 几 个 词语 ， 所 有 网 络 巨头 都 开始 吹 咕 自 己 现在 能 够 提 
































D 
























































































































































第 18 章 ”抽象 方法 超出 常理 的 有 效 性 | 281 








供 些 什么 新 服务 。 

深度 学 习 那 引发 表 动 的 成 功 与 经 典 软 件 工程 的 众多 方法 形成 了 鲜明 的 对 比 。 
人 们 习惯 先 构 筑 一 个 理论 ， 用 来 保证 某 项 技术 能 正确 运作 ; AE, MAITRE 
地 发 现 技术 超出 了 理论 。 这 就 引发 了 下 面 这 个 永恒 的 问题 : 理论 和 实践 之 间 的 差 
距 从 何 而 来 ? 有 一 句 稍 皮 话 是 这 样 说 的 :“ 理 论 上 它们 是 一 样 的， 但 是 在 实践 中 
Wie 

但 深度 学 习 的 情况 似乎 与 此 正好 相反 。 似 乎 没有 任何 理论 能 够 预言 我 们 手头 
上 的 这 项 技术 会 取得 成 功 。 理 论 研究 者 被 打 了 个 措手不及 。 深 度 学 习 的 性 能 简直 
好 得 离谱 ， 但 似乎 没有 人 知道 为 什么 。 深 度 学 习 在 实践 中 效果 很 好 ,但 它 在 理论 上 
是 否 可 行 ? 这 次 ， 实 干 家 对 这 个 问题 感 兴趣 ， 是 因为 他 们 也 感觉 到 ， 深 度 学 习 在 理 
论 理解 上 取得 的 任何 进步 ， 都 有 可 能 显著 地 甚至 戏剧 性 地 推动 人 工 智能 的 发 展 。 

但 深度 学 习 到 底 是 什么 ? 今天 ， 相 关 的 研究 论文 不 可 胜 数 ， 我 们 很 难 勾勒 出 
这 一 领域 的 边界 。 但 粗略 地 说 ， 深 度 学 习 就 是 研究 那些 包含 多 层 隐 藏 变量 的 模型 ， 
例如 LDA 和 某 些 玻 尔 效 曼 机 。 虽 然 如 此 ， 与 第 17 章 的 例子 相反 的 是 ， 深 度 学 习 
架构 不 一 定 需要 尝试 描述 某 种 概率 分 布 。 实 际 上 ， 大 部 分 深度 学 习 架 构 是 为 了 对 
某 些 确定 性 函数 进行 近似 而 设计 的 神经 网 络 "。 但 是 ， 所 有 这 些 结构 都 有 一 个 共同 
点 : 它们 都 使 用 了 深度 隐藏 的 变量 ， 也 就 是 那些 与 可 观测 变量 在 直觉 上 相距 其 远 
的 变量 。 更 严谨 的 说 法 是 ， 所 有 从 可 观测 变量 传递 到 深度 变量 的 信号 都 要 经 过 大 
量 中 间 变 量 。 

这 就 会 让 人 觉得 ， 某 个 隐藏 变量 的 抽象 层次 可 以 用 它 的 深度 来 衡量 。 的 确 ， 
从 直觉 上 说 ， 抽 象 与 实体 相反 。 我 们 自然 会 认为 可 观测 变量 对 应 着 模型 中 的 实体 ， 
而 深度 变量 则 对 应 着 抽象 。 这 就 是 本 章 标题 的 来 源 一 一 我 们 最 终 会 将 其 与 抽象 的 
数学 联系 起 来 ! 

深度 学 习 的 成 功 所 引出 的 理论 问题 就 是 如 何 解 释 抽象 方法 那 超出 常理 的 有 效 
性 。 这 一 有 效 性 的 来 源 大 概 有 三 种 解释 : 第 一 种 是 对 原始 数据 必 不 可 少 的 预先 概 
括 ， 第 二 种 是 深度 模型 ( 特别 是 深度 神经 网 络 ) 特有 的 表达 能 力 ， 而 第 三 种 ， 也 


























































































































中 ”比如 说 ,我 们 之 前 提 到 的 GAN 就 是 先 固定 深层 变量 的 概率 分 布 Zz， 然后 调整 某 个 函数 /来 生 
成 可 信 的 数据 工 = fO. 











282 | 贝 叶 斯 的 博弈 : 数学 、 思 维 与 人 工 智能 





是 依 我 看 来 最 有 前 途 的 一 种 ， 藏 在 我 们 和 希望 研究 的 数据 的 算法 性 质 之 中 ， 可 以 用 
所 罗 门 诺 夫 的 精致 度 以 及 查尔斯 * 本 内 特 的 逻辑 深度 来 衡量 。 
但 我 们 先 来 看 看 对 原始 数据 进行 概括 的 必要 性 。 





在 深度 学 习 大 获 成 功 之 前 ， 专 业 的 数据 科学 家 必须 干预 机 器 学 习 的 算法 ,为 

的 是 对 原始 数据 进行 “清理 "， 预 完 简 化 数据 的 分 析 。 深 度 学 习 人 研究 的 主要 动机 之 
一 就 是 希望 将 数据 预 处 理 自动 化 ， 绕 过 对 数据 科学 家 技能 的 需求 。 这 种 做 法 让 深 
度 学 习 成 为 一 把 瑞士 军刀 ， 能 够 适应 各 种 媒介 ， 无 论 是 图 像 、 音 频 、 视 频 、 文 字 
还 是 其 他 实时 传感器 的 探测 结果 。 
要 理解 这 一 点 ， 我 们 首先 迅速 回顾 一 下 人 工 神 经 网 络 。 这 些 网 络 就 是 一 大 堆 
神经 元 (通常 是 虚拟 的 )， 它 们 通过 所 谓 的 突 触 相互 连接 ， 就 像 互 联网 中 的 计算 机 
或 者 我 们 大 脑 中 的 神经 元 那样 。 其 中 一 些 神经 元 直接 连接 着 输入 数据 的 传感器 ， 
可 以 是 镜头 、 麦 克 风 或 者 其 他 测量 仪器 。 这 些 神 经 元 对 应 的 是 可 观测 变量 UL 

然后 ， 神 经 网 络 就 会 将 这 些 可 观测 神经 元 与 隐藏 神经 元 连接 起 来 。 这 个 过 程 也 
类 似 于 我 们 在 第 13 章 谈 到 的 混杂 因素 和 简明 因素 ， 它 们 可 以 帮助 我 们 在 公立 医院 和 
私人 诊所 之 间 做 出 选择 ， 还 能 解释 绵羊 毛色 之 间 的 相关 性 。 也 就 是 说 ， 隐 藏 神 经 元 
对 数据 的 处 理 可 以 被 看 作对 某 个 能 解释 已 观测 变量 之 间 相 关 性 的 重要 抽象 概念 的 计 
jx. 一 般 人 情况 下 ， 这 样 的 隐藏 神经 元 可 以 探测 到 可 观测 神经 元 接收 到 的 图 像 中 是 否 
存在 某 些 特征 。 于 是 ， 层 层 堆 积 的 神经 元 就 能 够 解释 中 间 各 层 神 经 元 之 间 的 相关 
性 。 一 般 而 言 ， 神 经 网 络 中 较 深 的 层次 可 以 从 不 同 的 特征 之 中 推断 出 图 像 中 是 否 
存在 绵羊 。 

这 一 过 程 的 灵感 其 实 来 自我 们 的 大 脑 皮 层 。 这 是 因为 神经 科学 发 现 ， 我 们 的 
大 脑 会 通过 逐步 抽象 的 方式 来 分 析 有 眼睛 所 看 到 的 事物 。 眼 睛 中 的 传感器 又 被 称 为 
视 锥 细胞 和 视 杆 细胞 ， 它 们 会 探测 那些 令 其 进入 激发 状态 的 光线 ， 得 到 光线 的 亮 
度 和 颜色 。 计 算 机 科学 家 会 说 ， 这 相当 于 图 像 中 每 一 个 像素 的 亮度 和 颜色 。 我 们 
赋予 深度 神经 网 络 的 可 观测 变量 的 ， 正 是 这 种 原始 数据 。 
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然后 ， 负 责 计算 的 第 二 层 神经 元 一 般 会 衡量 相 邻 像素 之 间 的 相关 度 。 人 类 的 
第 二 层 神 经 元 都 会 连接 着 眼睛 的 几 个 视 锥 细胞 和 视 杆 细 胞 。 举 个 例子 ， 在 连接 的 
视 锥 细胞 和 视 杆 细胞 都 被 激活 或 者 都 没有 被 激活 的 时 候 ， 神 经 元 才 可 能 激活 s 

接 下 来 ， 第 三 层 神经 元 会 将 这 些 相关 度 结合 起 来 ， 在 眼睛 看 到 的 图 像 中 找 出 
明显 的 线条 。 第 四 层 神 经 元 则 会 将 线条 结合 起 来 ， 以 此 得 知 图 像 中 的 基本 对 象 ， 
比如 绵羊 的 耳 人 条 、 了 眼睛 或 脚 。 之 后 的 层次 继而 将 这 些 基 本 对 象 结合 起 来 ， 确 定 更 
深层 次 的 结构 ， 比 如 图 像 中 是 否 存 在 绵羊 。 

今天 ， 人 工 智能 的 前 沿 就 是 所 谓 的 卷 积 神经 网 络 〈 convolution neural network, 
简称 CNN， 因 为 它们 与 数学 中 的 卷 积 运算 有 关 o 这 些 网 络 的 灵感 就 是 来 自视 皮 
层 的 大 体 结构 。 猜 不 到 吧 ? 我 们 本 来 探寻 的 是 如 何 才能 整体 提高 人 工 神 经 网 络 的 
性 能 ， 但 得 到 的 人 工 神 经 网 络 在 经 过 照片 训练 之 后 ， 竟 然 像 人 类 的 神经 网 络 一 样 ， 
可 以 计算 图 像 中 层次 越 来 越 高 的 抽象 概念 。 图 像 分 析 的 性 能 似乎 依靠 的 正 是 这 种 
抽象 层次 的 堆积 ， 而 只 有 深度 足够 大 的 网 络 才 能 做 到 这 一 点 。 































































































单词 的 向 量 表示 


人 们 在 自然 语言 处 理 的 经 验 中 也 发 现 了 类 似 的 现象 。 自 然 语言 处 理 的 难点 之 
一 就 是 含有 大 量 的 自然 语言 词汇 。 与 其 让 单一 的 神经 元 专门 负责 每 一 个 词语 的 理 
解 ， 不 如 通过 每 个 词语 与 其 他 词语 之 间 的 关系 来 理解 它们 。 奇 怪 的 是 ， 用 数学 的 
语言 来 说 ， 要 做 到 这 一 点 ， 我 们 可 以 将 词语 组 成 的 空间 骨 入 高 维 线性 空间 中 ， 这 
个 维度 一 般 来 说 在 50 和 100 之 间 。 用 不 那么 星 深 的 语言 来 说 ， 每 一 个 词语 都 会 对 
应 着 多 个 神经 元 的 某 个 激活 组 合 。 

2013 年 ， 一 个 由 托马斯 . 米 科 洛 夫 领导 的 谷歌 研究 团队 成 功 让 神经 网 络 学 会 
了 之 前 说 的 这 种 英语 单词 的 神经 元 表达 ， 这 是 一 项 引 人 注 目的 成 就 。 他 们 将 这 种 
表达 称 为 word2vec。 这 种 表达 能 以 前 述 的 方式 将 所 有 英语 单词 转换 为 高 维 空间 中 
的 向 量 。 人 们 借 此 对 所 有 单词 组 成 的 集合 在 表示 方式 上 进行 精简 化 与 结构 化 ， 因 




































































中 ”这 只 是 个 例子 ， 我 不 打算 援引 贴 合 实际 的 生物 学 过 程 。 
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为 从 信息 的 角度 来 看 ， 单 词 的 向 量 表示 更 紧凑 ， 仅 需 更 少 的 比特 数 就 能 描述 。 

但 好 处 不 止 于 此 ! 单词 的 向 量 表示 还 能 解释 单词 之 间 的 众多 联系 。 的 确 ， 米 
科 洛 夫人 研究 团队 的 重大 发 现 之 一 ， 就 是 单词 之 间 的 向 量 加 法 符合 我 们 的 直觉 。 比 
如 ， 他 们 发 现 如 果 进 行 皇帝 - 男人 + 女人 的 向 量 运 算 的 话 ， 得 到 的 结果 大 概 就 是 
皇后 这 个 词语 的 向 量 表达 外! 

更 令 人 着 迷 的 是 ,我 们 在 GAN 中 也 能 观察 到 这 种 现象 。 收 集 一 些 戴 太阳 镜 的 
人 的 图 像 和 没 戴 太阳 镜 的 人 的 图 像 ， 你 可 以 利用 GAN 计算 出 戴 太阳 镜 的 人 对 应 的 
向 量 平均 值 以 及 没 戴 太阳 镜 的 人 对 应 的 向 量 平 均值 。 然 后 将 这 两 个 向 量 相 减 ， 得 
到 的 差 就 是 某 个 向 量 S$， 从 直觉 上 来 说 ， 它 对 应 着 “ 戴 太 阳 镜 ”"。 现 在 考虑 一 张 没 
戴 太阳 镜 的 人 的 图 像 ， 计 算 它 的 向 量 表 示 I， 然后 加 上 “ 戴 太阳 镜 ” 的 向 量 表示 
人 S， 就 得 到 了 一 个 新 向 量 S + 现在 利用 GAN 生成 这 个 向 量 的 对 应 图 像 。 令 人 慰 
叹 的 是 ， 得 到 的 图 像 就 是 原来 的 图 像 中 的 人 戴 上 了 眼镜 趾 ! 真是 难以 置信 ! 

神经 网 络 对 不 同 抽象 概念 的 向 量 求 和 结果 的 诠释 竟然 如 此 契合 大 脑 对 这 些 概 
念 的 直觉 组合。 据 我 所 知 ， 这 种 契合 仍然 相当 难以 理解 。 这 是 今天 人 工 智 能 研究 
中 一 个 不 可 思议 的 谜团 一 一 我 打赌 ， 再 过 几 年 这 个 谜团 就 会 被 解 开 ， 而 我 已 经 迫 
不 及 待 了 ! 

据 此 ， 能 够 阅读 实体 书 的 神经 网 络 应 该 是 一 个 深度 神经 网 络 ， 其 中 前 几 层 是 
卷 积 神经 网 络 ， 能 够 识别 图 像 中 的 字符 。 然 后 ， 在 负责 视觉 的 这 几 层 神经 元 之 下 ， 
我 们 会 发 现 一 层 能 将 字符 合并 为 词语 的 神经 元 ， 以 及 另 一 层 将 词语 转化 为 向 量 的 
神经 元 ， 就 像 word2vec 所 做 的 那样 。 最 后 ， 还 有 几 层 神经 元 负责 解释 那些 表示 词 
语 的 向 量 ,将 它们 与 其 他 概念 联系 起 来 。 这 些 概念 可 以 来 自 对 图 像 或 者 其 他 信号 
的 额外 分 析 。 

因此 ， 高 效 的 深度 神经 网 络 在 看 到 猫 的 照片 或 者 读 到 “ 猫 ” 这 个 词语 的 时 候 ， 
应 该 能 够 激活 同一 组 神经 元 。 为 此 ， 对 原始 数据 的 预 处 理 似乎 至 关 重 要 。 一 般 来 
讲 ， 对 于 原始 数据 的 概括 来 说 ， 无 论 是 为 了 压缩 体 量 宏大 的 原始 数据 ， 让 计算 能 
够 在 合理 的 时 间 内 完成 ， 还 是 为 了 揭示 原始 数据 中 相关 性 的 切实 解释 ， 网 络 深度 
似乎 都 必 不 可 少 。 
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指数 式 的 表达 能 力 * 





2016 年 6 月 16 日 ,美国 斯 坦 福 大 学 、 美 国 康 奈 尔 大 学 以 及 谷歌 大 脑 ( Google 
Brain) 的 合作 研究 人 员 在 arXiv 上 传 了 两 篇 非 同 凡响 的 论文 。 我 被 它们 对 抽象 
方法 所 获 成 功 的 别 样 解释 深 深 迷 住 了 。 在 本 书 中 ,我 只 能 描述 其 中 于 我 而 言 最 
有 吸引 力 的 那 一 篇 。 这 篇 论文 题 为 《深度 神经 网 络 中 经 由 暂 态 混沌 出 现 的 指数 
性 表达 能 力 》(“Exponential Expressivity in Deep Neural Networks through Transient 
Chaos”)。 它 结合 了 大 量 复 杂 、 高 深 却 鲜 有 联系 的 数学 概念 ， 比 如 混沌 理论 、 平 均 
场 论 和 几何 曲率 。 

我 们 慢 慢 解释 。 这 篇 论文 一 开头 就 认为 ， 神 经 网 络 不 过 是 一 个 复杂 的 数学 也 
数 。 这 个 函数 以 一 组 测量 数据 作为 输入 ， 然 后 将 其 转化 为 深度 概念 的 组 合 。 测 量 
数据 的 集合 在 数学 上 组 成 了 一 个 所 谓 的 向 量 ,我 们 可 以 将 它 看 成 极 高 维度 的 空间 中 
的 一 个 点 。 而 深度 概念 的 组 合 也 是 如 此 ， 它 本 和 里 就 是 极 高 维度 的 空间 中 的 一 个 点 。 

这 样 的 话 ， 神 经 网 络 就 可 以 被 看 成 从 第 一 个 空间 到 第 二 个 空间 的 几何 变换 。 
这 篇 论文 提出 的 问题 如 下 :“ 典 型 ”的 神经 网 络 是 如 何 将 空间 变形 的 ? 一 个 “随机 
选取 ”的 神经 网 络 平均 而 言 是 不 是 会 将 这 些 点 到 处 移动 ? 还 是 说 ， 它 会 在 变换 中 
保留 曲线 的 某 些 几何 特性 ? 

这 篇 论文 的 回答 引 人 深 思 : 几何 结构 的 复杂 度 会 随 着 神经 网 络 深 度 的 增加 呈 
指数 增长 。 更 准确 地 说 ， 论 文 研究 了 几何 图 形 的 全 局 曲率 "。 从 直觉 上 来 说 ， 圆 就 
是 弯曲 程度 最 小 的 闭合 图 形 ， 因 为 它 的 弯曲 是 为 了 回 到 自己 的 出 发 点 。 此 外 ,无 
论 圆 的 大 小 如 何 ， 它 的 全 局 曲率 总 是 等 于 tx 6.28。 反 之 ， 一 条 在 空间 中 的 所 有 维 
度 上 都 反复 摆动 的 精细 曲线 会 拥有 非常 大 的 全 局 曲率 。 

这 篇 论文 证 明了 ， 对 于 足够 “激动 ”的 随机 神经 网 络 ， 几 何 图 形 的 曲率 会 随 
着 网 络 宽度 的 增长 而 呈 多 项 式 函 数 上 升 ， 并 随 着 深度 的 增长 呈 指 数 上 升 。 换 句 话 
说 ， 比 起 宽度 ， 网 络 的 深度 能 让 神经 网 络 以 更 快 的 速度 使 对 应 的 几何 变换 变 得 更 












































































































































复杂 。 


所 以 ， 这 说 明 深 度 是 识别 与 分 析 分 形 结构 的 关键 ， 分 形 结构 代表 的 就 是 那些 




















中 ”全 局 曲率 就 是 曲线 方向 上 单位 向 量 导 数 的 范 数 的 积分 。 
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并 不 总 是 光滑 且 正 则 的 行为 。 然 而 ， 在 我 们 周围 的 这 个 世界 之 中 ,分 形 结构 似乎 
无 处 不 在 向 ， 无 论 是 在 生物 学 、 宇 宙 学 还 是 金融 之 中 ! 
同样 ， 即 使 这 种 说 法 看 似 抽象 甚至 荡 雇 ,但 在 所 有 图 像 组 成 的 浩瀚 集合 之 中 ， 
所 有 包含 猫 的 图 像 组 成 的 集合 很 可 能 同样 有 着 分 形 结构 。 因 此 ， 网 络 的 深度 可 能 
就 是 识别 图 像 中 有 没有 猫 的 关键 ， 对 于 众多 更 复杂 的 任务 来 说 也 是 如 此 。 






































复杂 性 的 涌现 





这 个 惊人 的 发 现 也 印证 了 我 在 差不多 那个 时 候 读 过 的 其 他 材料 ， 尤 其 是 由 妆 
恩 ' 卡 罗 尔 、 斯 科 特 ， 阿 伦 森 和 劳 伦 ' 韦 羔 特 共同 撰写 的 一 篇 论文 四， 其 主题 是 
宇宙 随时 间 出 现 的 复杂 度 。 这 篇 论文 尝试 揭示 的 物理 原则 是 一 个 能 够 同时 在 宇宙 、 生 
MARKERE ( 图 18.1 ) 中 观察 到 的 现象 。 一 开始 ， 这 些 结构 都 很 简单 。 宇 宙 是 一 
团 近 乎 均匀 的 等 离子 体 ， 就 像 咖啡 杯 中 有 一 层 黑 咖 啡 ， 上 面 有 一 层 牛 奶 ， 而 且 生命 
岂 并 不 存在 。 这 些 结构 的 炉 也 很 低 ， 我 们 在 第 15 MESA ST AET s 



























































图 18.1 欧 蕾 咖啡 中 的 分 形 。 图 片 来 自 Pixabay 上 的 Pexels 


虽然 炉 一 开始 很 低 ,但 它 只 会 随 着 时 间 升 高 ”“。 这 一 原则 正 是 热力 学 第 二 定律 。 
另外 ， 精 的 增加 可 以 解释 成 均一 化 的 过 程 。 从 非常 长 远 的 角度 来 看 ， 咖 啡 杯 中 的 
咖啡 和 牛奶 会 完美 混合 ， 生 命 会 完全 消失 ， 宇 宙 也 会 变 成 一 片 完全 均一 的 星际 虚 























(D 真正 的 论证 更 复杂 ， 但 我 在 这 里 就 不 展开 了 。 
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zs (又 叫 作 “ 大 冻结 ”"， 英 文 是 Big Chill). Rm, KE- 卡 罗 尔 凭 直觉 认为 ， 
些 结构 ， 无 论 是 宇 害 、 生 命 还 是 欧 盖 咖啡 ,在 初始 和 终 末 之 间 都 必然 会 经 过 高 
复杂 的 阶段 ， 无 论 是 我 们 今天 能 观察 到 的 星系 与 大 尺度 纤维 结构 ， 还 是 动 植 物 后 
类 大 脑 极端 的 复杂 性 ， 抑 或 牛奶 在 咖啡 中 构成 分 形 图 案 的 奇怪 阶段 。 

MR + 卡 罗 尔 在 计算 机 科学 家 斯 科 特 ' 阿 伦 森 的 帮助 下 ， 严 格 叙述 了 这 个 直 
觉 上 的 概念 。 第 一 步 就 是 物理 现象 的 数字 化 。 所 有 东西 都 可 以 归结 为 一 串 0 和 1 
比如 将 咖啡 的 图 像 用 PNG 或 者 JPG 格式 编码 )， 然 后 卡 罗 尔 、 阿 伦 森 与 韦 莱 特 开 
始 在 这 些 有 限 0-1 序列 中 尝试 寻找 符合 卡 罗 尔 直觉 的 算法 复杂 度 描 述 。 

这 三 位 研究 者 展示 了 四 种 已 在 文献 中 出 现 的 定义 : 精致 度 、 表 观 复杂 度 
(apparent complexity )、 逻 辑 深 度 以 及 光 锥 复杂 度 (light-cone complexity, XE 
不 深入 探讨 ) 有 趣 的 是 ， 这 些 定 义 相互 之 间 其 实 都 有 着 微妙 的 联系 。 
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柯 尔 莫 哥 洛 夫 精致 度 * 





我 们 先 来 看 看 精致 度 ， 它 是 由 柯 尔 莫 哥 洛 夫 提出 的 ， 依 赖 于 所 罗 门 诺 夫 复杂 
度 。 人 们 也 许 会 认为 ， 所 罗 门 诺 夫 复杂 度 是 衡量 有 限 0- 1 序列 复杂 度 的 好 方法 。 
不 巧 的 是 ， 在 序列 非常 随机 ， 其 至 在 没有 任何 规律 的 时 候 ， 这 一 复杂 度 实际 上 会 取 
到 最 大 值 。 然 而 ， 这 种 没有 规律 性 的 状态 似乎 更 应 该 对 应 彤 的 最 大 值 ， 而 在 宇宙 、 
LE A RUE RS ATER, x T ABE OSEE e AE TER TES BIA S: 均匀 的 虚无 。 

跟 大 约 一 个 世纪 前 的 玻 尔 效 曼 一 样 ， 柯 尔 莫 哥 治 夫 想 出 了 一 个 绝妙 的 主意 ， 
将 容易 描述 的 “宏观 ”结构 与 最 适合 用 完全 随机 的 噪声 来 描述 的 “微观 ”结构 尽 
量 分 离开 来 。 柯 尔 莫 哥 洛 夫 精致 度 表达 的 正 是 这 一 直觉 。 

我 们 将 宏观 结构 称 为 $s。 粗略 地 说 ， 如 果 0--1 序列 x 的 微观 结构 足够 随机 ， 
即 在 已 知 5 的 情况 下 ， 在 其 他 同样 拥有 结构 S 的 0-1 序列 集合 之 中 ,0 一 1 序列 x 
的 所 罗 门 诺 夫 复 杂 度 ( 几乎 ) 是 最 大 的 。 也 就 是 说 ,我们 认为 x 是 5 的 一 个 典型 
实例 ， 可 以 将 x 精确 描述 为 S$ 加 上 一 段 几 乎 均一 的 噪声 。 为 了 使 S$ 成 为 x 的 “有 
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将 x 等 同 于 S 加 上 噪声 的 描述 


这 个 4 











IAN 





x 
E 





就 应 该 与 x 
性 质 的 宏观 结构 都 符合 柯 尔 莫 哥 治 天 的 要 求 。 
哥 洛 夫 将 0-1 序列 x 的 精致 度 定义 为 符合 此 前 


最 简洁 的 描述 ”同样 紧 


要 





求 的 所 有 宏观 结 


MJ S 的 最 小 所 罗 门 诺 夫 复 杂 度 。 从 直觉 上 来 说 ， 这 就 对 应 着 将 x 描述 为 一 个 简单 





的 宏观 结构 加 上 ( 几乎 ) 均匀 随机 噪声 的 最 优 方法 。 
不 巧 的 是 ， 跟 所 罗 门 诺 夫 复杂 度 一 样 ，0- 1 序列 
计算 的 。 为 了 估计 模拟 实验 中 0-1 序列 的 精致 度 ， 阿 
了 一 种 简易 版 的 精致 度 ， 他 们 将 其 称 为 表 观 复杂 度 。 
是 仅 仪 考虑 对 应 着 某 种 光滑 化 结构 的 宏观 描述 S。 这 利 
尔 效 曼 的 想法 。 与 其 单独 考虑 每 个 粒子 ， 玻 尔 效 曼 更 




















几乎 处 于 相同 位 置 的 粒子 组 成 的 集合 ， 然 后 描述 它们 


的 精致 度 一 般 来 说 也 是 不 可 
伦 森 、 卡 罗 尔 和 韦 莱 特 利用 
这 个 简易 版 精致 度 的 原则 就 
光滑 化 的 灵感 其 实 也 来 自 玻 
倾向 于 考虑 那些 在 给 定时 刻 
的 粗略 统计 性 质 。 三 位 研究 














者 在 分 析 欧 蕾 咖啡 的 模拟 结果 时 用 到 的 正 是 这 种 表 观 复杂 度 ”。 


精致 度 就 是 所 罗 门 诺 夫 的 MAP 估计 ! * 
虽然 柯 尔 莫 哥 洛 夫 精致 度 有 一 种 数学 上 的 美感 ， 
理 对 象 的 描述 中 的 直 
说 ， 精 致 度 要 求 在 已 知 宏观 描述 S 的 情况 下 ,序列 x 
度 ， 这 种 要 求 是 不 是 有 些 随意 ? SUAE SH 
的 概念 ， 这 是 不 是 类 似 的 情况 ? 我 们 难 
更 深刻 的 概念 吗 ? 
(D 


a. 
DE; 
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Hx 


E 
道 





令 x 为 0-1 序 列 ， 我 们 将 所 有 与 宏 
S 的 元 素 足 够 “随机 ”， 那 就 等 
RÉ 


ES 





构 S 相 容 的 0-1 序列 的 外 
F 说 所 罗 门 诺 夫 复 杂 度 的 余 量 K-K) KE 
的 朴素 识别 方式 的 长 度 ， 就 是 将 所 有 元 素 编号 后 的 编码 长 度 。 用 


由 似乎 切实 关联 着 我 们 对 物 


然而 我 们 也 会 怀疑 它 是 不 是 真正 正确 的 描述 方法 。 比 如 


d 


关 须 拥有 几乎 最 大 的 随机 程 





后 就 被 香农 推广 为 更 普遍 、 更 基本 
不 应 该 优先 利 











概率 语言 来 触及 精致 度 
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ER tif S。 如 果 说 x 作为 
PIER x Æ S 





























BI c 





MCEK(x)-K(S) > log|S|-c, iXH 
朴素 精致 度 的 类 似 概 念 有 着 微小 的 
夫 复 杂 度 KGCxlS)。 








个 “很 小 ”的 常 








符号 的 语言 来 说 ， 这 就 相 


带 数 。 要 注意 到 这 与 另 一 种 被 称 为 





差异 ， 在 这 一 概念 中 ，KGCoD)-K(CS) 被 换 成 了 条 件 所 罗 门 诺 








"és 


在 某 种 意义 上 ， 这 相当 于 将 理论 上 的 精致 度 换 成 了 某 利 





i: FJ 








”精致 度 。 理 论 上 的 精致 度 有 


























一 个 缺点 : 它 在 定义 中 包含 了 某 些 计算 时 间 长 得 不 合 到 
了 寥寥 几 个 快速 算法 。 


E 的 算法 ， 而 “实用 








”精致 度 则 只 用 到 
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纯粹 贝 叶 斯 主义 者 的 回答 是 肯定 的 ! 我 对 贝 叶 斯 主义 最 激动 人 心 的 思考 之 一 ， 
就 是 发 现 了 优雅 的 柯 尔 莫 哥 洛 夫 精 致 度 其 实 就 是 所 罗 门 诺 夫 妖 理论 中 某 个 子 集 的 
最 大 后 验 ( MAP) 估计 ! 

S 7 了 为 宏观 结构 5 的 算法 描述 。7 就 是 所 罗 门 诺 夫 意 义 上 的 一 个 预测 性 理论 ， 
它 尝试 解释 的 就 是 序列 x。 因 此 ， 在 已 知 x 的 情况 下 , 7 的 置信 和 度 可 以 通过 贝 叶 斯 
公式 计算 出 来 : 
































_ PRITIPIT] 
PTE 
另外 ， 我 们 知道 ， 对 于 所 罗 门 诺 夫 意义 上 的 理论 ， 它 的 先 验 置信 和 度 PDT] 必然 
随 着 所 罗 门 诺 夫 复杂 度 KT) 时 指数 递减 了。 写 下 来 就 是 P[7]=exp(-wK(C7))。 为 了 
计算 所 风门 诺 夫 妖 的 MAP 估计 ， 我 们 只 需 将 分 子 的 对 数 最 大 化 ， 这 等 价 于 最 小 化 
分 子 对 数 的 相反 数 。 我 们 有 











MAP(x) = argmin(z K(T) -InP[x|T]) 








想不到 吧 ! 如 果 我 们 只 考虑 这 样 的 理论 7， 使 得 PI T] 是 关于 0-1 序列 的 均 
匀 分 布 的 话 ， 那 么 利用 对 偶 理 论 ”就 能 证 明 存在 一 个 a 的 值 ， 使 得 M4P(x) 恰好 是 
柯 尔 莫 哥 洛 夫 精 致 度 意义 上 的 最 优 宏观 描述 ”! 

因此 ， 正 如 香农 对 箭 的 推广 将 信息 与 不 确定 性 等 概念 扩展 到 非 均匀 分 布 上 ， 
所 罗 门 诺 夫 妖 同样 指引 我 们 ,将 利用 柯 尔 莫 哥 洛 夫 精 致 度 得 到 的 数据 的 宏观 描述 
扩展 到 所 对 应 的 微观 不 确定 性 并 非 均匀 的 那些 宏观 描述 上 ! 特别 是 ， 柯 尔 莫 哥 洛 
夫 精 致 度 尝 试 度量 的 ， 似 乎 更 类 似 于 在 给 定数 据 x 的 情况 下 ,算法 形式 可 信 理 论 
的 所 罗 门 诺 夫 复杂 度 。 


















































中 ”实际 上 ,我 在 这 里 考虑 的 K(7) 是 了 的 算法 描述 长 度 ， 而 不 是 它 的 最 优 压缩 。 
D 这 是 因为 与 精致 度 计算 相关 的 拉 格 朗 日 乘 子 是 Ce(S, p) = (0 40 KC) -udogilS| ue -uKQ)s TUIS 
线性 规划 的 强 对 偶 性 质 ， 我 们 可 以 推断 出 ， 存 在 人 m 0， 使 精致 度 的 计算 相当 于 在 8$ 上 寻找 

















一 个 能 使 CHIR? K(9)+lnlsl 最 大 化 的 分 布 。 然 而 ， 这 正 是 所 罗 门 诺 夫 MAP 估计 的 等 式 ， 








其 中 xc=(1+A)(n 2)W*， 而 理论 7 了 则 是 S$ 上 的 均匀 分 布 。 
© 此外， 我 们 也 能 看 到 柯 尔 莫 哥 洛 夫 精致 度 中 < 的 主观 性 对 应 着 所 罗 门 诺 夫 所 用 偏见 中 的 主 
TE (尤其 是 在 预测 性 理论 的 所 罗 门 诺 夫 复杂 度 上 附加 的 衰减 因子 a )。 
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当然 ， 所 罗 门 诺 夫 妖 提 示 我 们 还 可 以 走 得 更 远 。MAP 毕竟 只 是 贝 叶 斯 公式 的 
粗略 近似 。 这 样 的 话 ， 与 其 仅仅 考虑 MAP 模型 这 个 唯一 的 宏观 描述 ， 所 罗 门 诺 夫 
妖 指 出 ， 可 以 考虑 所 有 宏观 描述 组 成 的 集合 ， 并 根据 它们 合适 的 置信 度 来 分 别 赋 
予 权重 。 也 就 是 说 ， 它 希望 我 们 引入 所 罗 门 诺 夫 精 致 度 这 个 概念 ， 这 也 是 后 验 可 
信 理 论 的 所 罗 门 诺 夫 复杂 度 的 数学 期 望 。 换 一 种 说 法 ， 我 提出 这 样 的 定义 : 

所 罗 门 诺 夫 精致 度 (x) = Er[K(T)|x] 






































据 我 所 知 ， 这 个 量 还 没有 被 研究 过 。 

卡 罗 尔 、 阿 伦 森 和 韦 莱 特 从 直觉 出 发 的 看 法 似乎 牵涉 宇宙 当前 物理 状态 极 高 
的 所 罗 门 诺 夫 精 致 度 。 就 像 莱 布 尼 次 惊异 于 竞 然 有 东西 存在 ， 而 不 是 什么 都 不 存 
在 ， 我 也 不 禁 惊 异 于 这 人 么 高 的 所 罗 门 诺 夫 精致 度 竟 然 存 在 ， 而 不 是 取 更 小 的 值 。 
或 者 化 用 笛 卡 儿 的 说 法 ,除了 “我 思 ” 这 一 事实 以 外 ， 还 有 其 他 东西 是 不 容 置 疑 
的 ， 那 就 是 极 高 的 所 罗 门 诺 夫 精致 度 的 存在 。 对 我 来 说 ， 这 就 是 宇宙 最 迷人 的 奥 
秘 ， 而 它 的 解释 也 许 就 埋藏 在 同样 神秘 的 热力 学 第 二 定律 之 中 …… 



























































本 内 特 的 逻辑 深度 





男 一 个 定义 同样 吸引 了 我 的 注意 ， 那 就 是 本 内 特定 义 的 逻辑 深度 。 粗 略 地 说 ， 
逻辑 深度 衡量 的 是 计算 观察 到 的 结构 所 需 的 时 间 。 

因此 ， 对 于 本 内 特 来 说 ， 欧 著 徊 啡 的 初始 状态 和 终 末 状态 都 “并 不 深刻 "， 因 
为 它们 都 可 以 用 算法 非常 迅速 地 计算 出 来 。 前 者 的 算法 就 是 “白色 在 上 ， 黑色 在 
下 ”， 而 对 于 后 者 来 说 ， 唯 一 能 够 计算 欧 蓄 徊 啡 中 每 个 粒子 位 置 的 算法 "必须 拥有 
所 有 粒子 的 信息 。 但 如 此 一 来 ， 粒 子 的 位 置信 息 就 在 算法 的 储存 空间 之 中 ， 算 法 
只 需要 读 取 储 存 空间 就 能 给 出 这 些 位 置 ， 这 无 须 太 多 时 间 “。 在 某 种 意义 上 ， 这 两 















































(D 或 者 说 ,是 所 罗 门 诺 夫 复杂 度 最 小 的 算法 。 

Q ”实际 上 ， 如 果 宇 窗 是 确定 性 的 ， 那么 只 需 从 初始 状态 对 宇 窗 进行 模拟 ; 而 如 果 这 个 初始 状态 
拥有 简短 的 描述 ， 那 么 模拟 只 需 少 量 信息 。 然 而 ， 可 能 有 人 会 说 ， 如 果 只 知道 最 终 状 态 ， 就 不 
可 能 在 合理 的 时 间 内 反 推 出 初始 状态 。 所 以 ， 这 种 情况 下 的 “实用 ”逻辑 深度 仍然 很 低 ， 因 
为 ， 能 使 生成 的 数据 迅速 被 鉴别 为 所 需 最 终 状 态 的 最 短 算法 ， 就 是 那些 已 知 最 终 状态 的 算法 。 
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种 情况 在 计算 上 都 毫 无 深度 。 

与 之 相反 ， 混 合 过 程 中 的 欧 茧 咖啡 所 展现 出 的 复杂 结构 似乎 能 够 利用 相对 简 
短 的 算法 来 描述 ， 然 而 这 样 的 算法 却 需要 花 上 许多 计算 时 间 来 确定 咖啡 中 粒子 的 
位 置 。 因 此 ， 咖 啡 和 牛奶 混合 时 的 过 渡 状 态 可 能 拥有 相当 高 的 逻辑 深度 。 阿 伦 森 、 
卡 罗 尔 和 韦 莱特 提出 ， 过 渡 状 态 的 这 种 极 高 的 逻辑 深度 并 不 局 限于 咖啡 杯 之 
其 实 ， 整 个 宇宙 现在 身 处 的 过 渡 状 态 同 样 拥有 庞大 的 逻辑 深度 。 

在 2018 年 ， 我 和 拉 希 德 . 格拉 维 利用 这 个 论证 ， 试 图 解释 深度 学 习 为 何 取 
得 了 成 功 四 。 我 们 首先 注意 到 ， 绝 大 部 分 机 器 学 习 算 法 是 非常 快速 的 ， 而 且 所 有 
层 数 不 多 的 神经 网 络 ( 在 并 行 化 之 后 ) 正好 组 成 了 所 有 快速 算法 的 集合 。 如 果 我 
们 相信 自己 身 处 的 宇宙 以 及 从 中 收集 的 数据 都 拥有 非常 大 的 (不 可 并 行 的 ”) 逻辑 
深度 的 话 ， 我 们 就 能 得 出 一 个 结论 : 这 些 没有 深度 的 算法 有 一 个 不 可 避免 的 弱点 ， 
那 就 是 它们 的 速度 ! 

现在 还 要 再 加 上 原始 数据 的 所 罗 门 诺 夫 复杂 度 ， 我 们 在 第 14 章 就 谈 到 了 。 我 
们 想 要 解决 的 预测 问题 似乎 必然 同时 需要 大 量 参数 和 足够 长 的 计算 时 间 。 然 而 ， 
这 正 是 深度 神经 网 络 的 特征 ! 除 此 之 外 ， 神 经 网 络 还 有 一 种 结构 ， 能 让 它们 实时 
学 习 ， 尤 其 可 以 利用 在 第 17 章 提 到 的 随机 梯度 下 降 法 。 这 就 解释 了 为 什么 深度 神 
经 网 络 能 够 达到 无 与 匹敌 的 性 能 ， 无 论 与 之 比较 的 是 人 类 开发 的 算法 ， 还 是 计算 
过 快 的 其 他 机 器 学 习 框 架 。 

因此 ， 如 果 对 现实 世界 建 模 或 者 解决 人 工 智能 中 的 问题 需要 一 定 逻 辑 深 度 的 
话 ， 那 么 计算 中 就 必须 有 一 定数 量 的 中 间 步 又 。 这 些 中 间 步 又 中 的 计算 对 应 着 隐 







































































































































































度 变量 ， 也 就 是 对 应 着 某 种 抽象 概念 。 
要 解释 抽象 方法 超出 常理 的 有 效 性 ， 这 个 宇宙 的 逻辑 深度 似乎 正 是 关键 所 在 。 











D 算法 的 可 并 行 性 也 跟 理论 计算 机 科学 中 的 P NC 问题 有 关系 。 这 个 问题 就 是 所 有 多 项 式 算 
法 能 否 在 多 项 式 台 机 器 上 并 行 化 ， 得 到 计算 时 间 为 对 数 的 多 项 式 的 并 行 算法 。 跟 大 部 分 计算 
机 科学 家 一 样 ， 我 们 猜想 这 个 问题 的 回答 是 否定 的 。 
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尽管 深度 学 习 大 有 成 为 机 器 学 习 中 抽象 方法 之 是 的 势 基 ,但 跟 数学 这 片山 蛮 
相 比 ， 它 只 能 算是 个 小 山 丘 。 在 人 类 建立 的 所 有 宏大 体系 之 中 ， 数 学 比 起 其 他 造 
物 要 远 远 更 抽象 、 更 深刻 。 数 以 千 计 的 著作 堆积 起 来 ， 朝 抽象 的 方向 越 走 越 远 ， 
即使 是 最 厉害 的 数学 家 也 要 认真 、 努 力 ， 才 能 沉浸 于 其 他 人 创造 的 抽象 概念 之 中 。 

要 解 开 寥寥 几 个 方程 的 部 分 秘密 ， 可 能 就 需要 数 年 其 至 数 十 年 的 沉思 。 一 些 
最 伟大 的 数学 家 甚至 把 职业 生涯 的 大 部 分 时 间 花 在 同一 个 方程 上 。 维 拉 尼 这 样 讲 
过 :“ 玻 尔 效 曼 方程 ， 真 是 世界 上 最 美丽 的 方程 (…… ) ! 我 在 还 小 的 时 候 就 遇 到 
了 它 , 我 的 意思 是 ， 在 我 读 博 士 的 时 候 。” 狄 拉克 也 说 过 ， 以 他 的 名 字 命 名 的 方程 
所 包含 的 智慧 超出 了 他 本 人 的 智慧 ， 他 没有 料 到 这 个 方程 在 物理 上 的 推论 ,尤其 
是 在 他 年 轻 的 时 候 中 。 而 我 期 望 能 在 这 本 书 中 与 你 顺利 分 享 于 我 而 言 贝 叶 斯 公式 
及 其 出 人 意料 又 难以 置信 的 推论 的 迷人 之 处 。 从 创作 本 书 的 两 年 前 开始 ， 它 们 就 
令 我 激动 不 已 ， 而 且 它 们 很 有 可 能 会 在 之 后 漫长 的 岁月 中 继续 令 我 着 迷 ! 

的 确 ， 要 用 我 们 有 限 的 大 脑 皮 层 一 步 一 步 理解 的 话 ， 数 学 实在 是 太 深 刻 了 。 
为 了 衡量 数学 对 象 ， 我 们 必须 时 时 寻觅 大 体 的 解释 : 为 了 思考 向 量 ， 我 们 必须 想 
象 出 一 个 箭头 ; 为 了 思考 非 欧 几 何 ， 我 们 必须 想象 一 块 被 拉扯 变形 的 布 ; 而 为 了 证 
明 有 关 素数 的 定理 ， 我 们 就 必须 仔细 考虑 它们 的 已 知性 质 。 

而 通常 来 说 ， 当 我 们 面 对 数 学 推理 中 堆积 成 山 的 计算 步骤 时 ， 可 能 想 立 刻 放 
弃 努 力 思考 ， 只 想 机 械 地 依据 计算 规则 做 到 最 后 。“ 闭 上 嘴 ， 然 后 去 计算 。” 戴 
DE + 默 明 就 是 这 样 概括 量子 力学 的 哥本哈根 诠释 的 。 人 们 可 能 会 以 为 ， 这 在 科学 
上 是 种 错误 的 做 法 。 我 们 不 是 要 尝试 理解 周遭 的 世界 吗 ? 如 果 这 就 是 目的 ， 那 就 
应 该 放弃 过 度 的 数学 抽象 。 

但 贝 叶 斯 公式 的 作用 并 不 是 让 可 靠 的 理论 适应 人 类 大 脑 的 认 知 能 力 。 它 的 目的 
是 预测 。 如 有 果 和 宇宙 的 逻辑 深度 很 大 ， 那 么 最 好 的 预测 方法 很 可 能 需要 极为 大 量 的 
， 但 这 些 步 骤 都 对 应 着 深入 的 计算 ， 它 们 必然 超出 了 我 们 的 直觉 。 

尤其 ， 数 学 的 深度 并 不 是 直觉 思考 所 能 比拟 的 。 毕 竞 ， 我们 的 直觉 似乎 只 能 
进行 迅速 的 计算 。 因 此 ， 直 觉 推 理 并 没有 什么 逻辑 深度 。 我 认为 ， 这 就 是 对 数学 
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超出 常理 的 有 效 性 的 主要 解释 。 也 就 是 说 ， 这 种 有 效 性 并 非 因为 宇宙 的 本 质 就 是 
数学 ( 我 本 人 在 理解 这 个 概念 上 很 有 困难 )， 而 是 来 自 这 个 宇宙 当前 物理 状态 的 逻 
辑 深度 ， 尤 其 是 因为 存在 一 些 逻 辑 深度 很 大 而 所 罗 门 诺 夫 精致 度 很 小 的 现象 。 除 
此 之 外 ， 还 有 我 们 认 知 能 力 上 的 限制 。 














数学 的 简洁 性 





数学 超出 常理 的 有 效 性 的 第 二 个 解释 就 是 其 惊人 的 简洁 性 。 说 到 底 ， 本 书 中 
绝 大 部 分 内 容 可 以 归结 为 贝 叶 斯 公式 ， 它 可 以 用 寥寥 几 个 字符 来 描述 。 换 句 话 说 ， 
这 本 书 可 以 用 比 自身 简洁 得 多 的 方式 来 描述 。 书 中 都 是 元 余 的 内 容 ， 它 的 所 罗 门 
诺 夫 精致 度 相 对 来 说 很 低 。 此 外 ， 我 甚至 认为 无 论 是 谁 ， 只 要 花 上 足够 长 的 时 间 
来 思考 学 习 的 本 质 ， 并 尝试 优化 自己 的 教学 方法 ， 都 能 写 出 与 这 本 书 相当 类 似 的 
另 一 本 书 。 我 相信 对 这 些 人 来 说 ， 我 在 这 里 所 写 的 都 是 些 显而易见 的 东西 ， 可 以 
轻松 被 高 度 压缩 。 但 这 些 东 西 对 于 教学 来 说 非常 有 用 。 

数学 最 伟大 的 成 就 之 一 就 是 数学 语言 的 汇总 ， 这 可 以 归功 于 花 拉 子 密 。 但 这 
还 不 够 。 除 了 简洁 以 外 ， 花 拉 子 密 的 数学 语言 读 起 来 一 板 一 眼 ， 不 存在 好 几 种 可 
能 的 解释 ， 而 且 无 须 花 时 间 仔细 思考 这 一 语言 中 每 个 符号 的 意义 四 。 事 实 上 ， 要 
确定 某 个 形式 证 明 是 否 正确 ， 只 需要 一 股 脑 儿 去 读 就 行 (但 要 非常 专心 ) 用 计算 
机 科学 的 术语 来 说 ， 阅 读 这 一 语言 只 需要 所 罗 门 诺 夫 复杂 度 很 小 的 算法 ， 即 使 算 
法 所 需 的 计算 时 间 可 能 很 长 。 

数学 简洁 性 最 惊人 的 例子 之 一 就 是 电动 力学 方程 。 当 物理 学 家 詹姆斯， 麦克 
Wii 1861 年 首次 引入 这 些 方程 的 时 候 ， 它 们 一 点 都 不 简洁 。 然 而 ， 数 学 不 断 
AN PRET RE EMILE L=- FE AT, 其 中 














































































































已 ,=8,4,-6,4.。 当 然 ， 要 通过 这 些 方程 进行 预测 ， 就 必须 用 到 整套 算法 工具 ， 但 
就 纯粹 计算 而 言 ， 描 述 这 些 工具 也 不 需要 多 长 的 篇 幅 。 

这 与 那些 非 形式 化 的 理论 形成 了 鲜明 对 比 ， 后 者 强烈 依赖 于 对 语言 和 其 他 人 
类 “常识 ”的 某 种 解释 。 然 而 ,语言 和 常识 的 算法 描述 很 可 能 需要 数 十 亿 行 代码 
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才能 接近 人 类 的 表现 。 正 如 我 们 在 第 14 章 中 看 到 的 那样 ， 对 于 图 灵 来 说 ， 这 解释 
了 为 什么 机 融 学 习 对 于 完全 掌握 语言 和 常识 来 说 必 不 可 少 。 因 此 ， 非 形式 化 理论 
的 问题 其 实 不 是 它们 不 精确 ， 而 是 它们 需要 所 风门 诺 夫 复杂 度 极 大 的 算法 ( 比如 
我 们 的 大 脑 ) 才能 拥有 预测 能 力 。 然 而 ， 如 果 我 们 相信 所 罗 门 诺 夫 的 偏见 ， 那 么 
所 罗 门 诺 夫 复 杂 度 极 大 的 理论 的 先 验 置信 和 度 就 会 呈 指 数 下 降 。 

当然 ， 自 然 语 言 以 及 人 类 大 脑 对 它 的 解释 并 不 是 任意 而 为 的 。 自 然 选 择 更 偏 
爱 那 些 能 够 预测 环境 和 原始 部 落 社会 关系 的 语言 和 认 知 过 程 。 然 而 ， 这 种 选择 偏 
好 并 没有 履 盖 那些 能 描述 粒子 物理 学 、 全 球 化 市 场 经 济 和 新 技术 影响 的 语言 和 认 
知 过 程 。 对 于 这 些 问 题 来 说 ， 即 使 是 非常 简化 的 数学 处 理 ， 在 纯粹 贝 叶 斯 主义 者 
的 偏见 中 也 会 获得 优势 ， 这 没什么 奇怪 的 。 

因此 ， 数 学 的 优雅 似乎 必 将 使 数学 家 仔细 探索 并 理解 那些 简洁 的 算法 ， 也 就 
是 在 所 罗 门 诺 夫 的 模型 下 拥有 相当 大 的 先 验 置信 度 的 算法 。 所 以 ,我们 观察 到 ， 
那些 基于 数学 语言 的 最 优秀 的 预测 性 理论 通常 在 经 验 中 也 更 可 信 ， 这 也 不 是 什么 
惊人 的 事情 。 














































































































数学 的 模块 性 














我 想 用 数学 超出 常理 的 有 效 性 的 第 三 个 也 是 最 后 一 个 解释 来 结束 这 一 章 ， 那 
就 是 数学 的 模块 性 。 优 雅 的 数学 定理 通常 处 于 大 量子 学 科 的 交叉 位 置 ， 构 建 了 数 
学 各 个 方面 的 桥梁 ， 它 们 就 像 一 把 瑞士 军刀 ， 只 要 使 用 方法 足够 巧妙 ， 就 能 解决 
大 量 问题 。 正 因 如 此 ， 导 数 、 向 量 空间 和 图 这 些 概 念 在 几何 学 、 最 优化 和 概率 中 
比比 缘 是 ， 而 且 在 物理 学 、 计 算 机 科学 、 生 物 学 、 化 学 和 经 济 学 中 也 无 处 不 在 。 
计算 机 科学 中 的 比特 、 列 表 结 构 和 排序 算法 也 属于 这 样 的 概念 。 定 理 组 成 了 预测 
性 理论 的 基石 ， 就 像 基 础 算法 组 成 了 所 有 复杂 源 代码 的 基石 那样 。 
程序 员 将 算法 分 解 成 小 块 ， 好 让 这 些 基 础 算法 一 次 又 一 次 地 应 用 在 全 体 代 码 
的 不 同方 面 。 与 之 类 似 ， 加 法 和 乘法 也 经 常 在 物理 模型 中 被 重复 使 用 ， 而 导数 这 
个 概念 也 通常 被 应 用 在 各 种 不 同 的 物理 量 中 。 这 样 的 话 ， 仅 仅 利用 非常 抽象 上 且 具 
有 普遍 性 的 方式 一 次 性 给 出 导数 的 定义 ,要 比 每 次 使 用 它 的 时 候 都 重新 定义 的 做 
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法 更 简单 、 更 优雅 。 因 此 ， 数 学 语言 让 我 们 可 以 研究 大 量 不 同 的 模型 
次 都 重新 发 明 轮 子 。 

现在 我 们 来 看 一 个 例子 ， 几 十 年 来 它 已 经 成 为 非 讲 不 可 的 话题 。 无 论 是 在 数 
学 、 机 器 学 习 、 材 料 科学 或 经 济 学 中 ， 实 践 中 的 大 量 问题 都 可 以 写成 在 不 同 约束 
条 件 下 对 某 个 目标 函数 的 最 小 化 问题 。 这 个 框架 就 是 最 优化 问题 ， 它 统一 了 大 量 
领域 。 用 于 仔细 分 析 并 解决 这 个 框架 之 下 的 问题 的 方法 ， 比 如 梯度 下 降 法 、 局 部 
搜索 和 遗传 算法 ， 都 算得 上 瑞 十 军刀。 通常， 如果 能 用 这 个 框架 建立 模型 ， 这 些 
方法 就 能 解决 大 量 问题 。 

理论 物理 学 的 情况 给 人 的 印象 更 深刻 ， 尤 其 是 量子 场 论 ， 它 远 远 不 是 一 
个 死板 的 单独 理论 ， 而 是 首先 建立 在 拉 格 朗 日 量 的 量子 化 钙 的 基础 之 上 。 的 
确 ， 自 从 理 查 德 . 费 曼 应 用 了 最 小 作用 量 原理 之 后 ， 物 理学 家 已 经 习惯 了 将 他 
们 的 量子 力学 写成 唯一 一 个 公式 ， 也 叫 拉 格 朗 日 量 ， 一 般 来 说 ， 它 的 形式 是 
L= iy^ Dui — 3Tr(F"" Fu), 无 论 拉 格 朗 日 量 的 具体 表达 如 何 ， 物 理学 家 
下 一 步 就 能 用 一 套 系统 化 的 方法 将 这 个 拉 格 朗 日 量 转化 为 涉及 偏 微分 的 运动 方程 
(也 叫 欧 拉 一 拉 格 朗 日 方程 ) 然后 ， 这 些 方程 可 以 被 量子 化 ， 接 下 来 就 能 从 方程 
中 得 到 量子 化 导出 的 预测 结果 。 也 就 是 说 ， 将 拉 格 朗 日 量 转化 为 一 组 预测 ， 这 个 
过 程 只 不 过 是 单纯 ( 但 宛 长 ) 的 计算 。 

更 厉害 的 是 ， 规 范 理 论 甚至 仅仅 从 拉 格 朗 日 量 的 对 称 性 出 发 ， 就 能 导出 它 的 
准确 公式 。 物 理 对 象 及 其 相互 作用 可 以 归结 为 对 它们 的 对 称 性 所 组 成 的 群 进行 抽 
象 研究 ， 这 种 做 法 实在 令 人 心醉 神 迷 。 诺 特定 理 正 是 以 这 种 方式 从 拉 格 朗 日 量 的 
时 间 平移 对 称 性 推导 出 能 量 守恒 ， 而 从 空间 平移 对 称 性 推导 出 的 则 是 动量 守恒 bm。 
更 进一步 的 话 ， 只 需 简单 提出 拉 格 朗 日 量 在 某 个 群 的 作用 下 不 变 ， 比 如 说 SU(S) 
这 个 群 ， 就 能 由 此 构筑 一 个 全 新 的 量子 场 论 。 这 真是 干 得 太 漂 亮 了 ! 理论 物理 学 
成 功 将 自身 从 光子 和 电子 等 基本 对 象 中 剥离 ， 只 需 考虑 像 拉 格 朗 日 量 的 对 称 群 这 
种 抽象 得 难以 置信 的 概念 。 

事实 上 ， 两 个 现代 理论 物理 学 的 伟大 发 现 就 是 通过 将 自身 限制 在 这 个 理论 框 
架 中 得 到 的 ， 而 且 它们 远 远 超前 于 实验 观察 的 结果 。1964 4E, BRIE - HREM 
治 . 茨 威 格 正 是 通过 这 种 方法 分 别 独立 提出 拉 格 朗 日 量 应 该 在 SUG) 这 个 群 的 作 
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用 下 不 变 。 他 们 发 现 ， 这 个 对 称 性 意味 着 质子 和 中 子 可 以 被 切 分 为 更 基本 的 粒子 ， 
它们 被 称 为 夸克 。 经 过 数 十 年 的 理论 研究 、 实 验 发 现 和 争议 之 后 ， 盖 尔 曼 和 次 威 
格 的 模型 最 终 被 广泛 接受 ， 自 此 成 为 粒子 物理 学 标准 模型 的 一 部 分 。 但 在 那个 时 
候 ， 盖 尔 曼 已 经 因为 其 他 工作 获得 了 诺 贝 尔 物 理学 奖 。 然 而 ， 诺 贝尔 奖 委 员 会 不 
愿意 在 不 向 盖 尔 曼 授 予 第 二 个 诺 贝尔 奖 的 情况 下 单独 向 次 威 格 授奖 ， 而 且 他 们 也 
不 愿意 向 盖 尔 曼 授 予 第 二 个 诺 贝尔 奖 。 所 以 次 威 格 从 来 没有 得 到 过 诺 贝 尔 奖 。 

还 有 比 这 更 惊人 的 。 还 是 在 1964 年 ， 三 组 物理 学 家 ， 分 别 是 弗 朗 索 瓦 ， 昂 格 
勒 和 罗伯特 ' 布 鲁 ， 彼 得 ' 硕 格 斯 ， 还 有 杰 拉 和 尔 德 ， 古 拉 尔 尼克 、 卡 尔 ， 哈 根 和 
汤姆 . 基 布尔 ， 他 们 各 自 独 立 发 现在 相对 论 框架 下 的 拉 格 朗 日 量 表达 与 带 质 量 粒 
子 的 存在 性 并 不 相 容 。 为 了 拯救 拉 格 朗 日 量 这 个 体系 ， 这 六 位 物理 学 家 引入 了 一 
个 新 的 量子 场 ， 这 个 量子 场 今天 被 称 为 希 格 斯 场 。 表 示 成 拉 格 朗 日 量 的 话 ， 它 遵 
循 所 谓 的 规范 对 称 性 ， 但 物理 状态 本 身 会 打破 这 种 对 称 性 。 引 人 注目 的 是 ， 经 典 
粒子 与 对 称 性 破 缺 的 希 格 斯 场 之 间 的 相互 作用 ， 与 粒子 本 身 拥有 质量 时 的 行为 完 
全 无 法 区 分 ! 更 妙 的 是 ， 对 希 格 斯 场 及 其 激发 态 的 量子 化 让 这 些 研 究 者 能 够 预言 
新 粒子 的 存在 ， 这 种 新 粒子 叫 作 和 希 格 斯 玻 色 子路。 你 可 能 也 已 经 知道 了 ,CERN 
的 大 型 强 子 对 撞 机 在 2012 年 通过 实验 发 现 了 和希 格 斯 玻 色 子 。 第 二 年 ， 希 格 斯 和 昂 
格 勒 就 获得 了 诺 贝尔 奖 。 

抽象 方法 又 获得 了 胜利 。 这 当然 有 运气 的 成 分 ， 但 从 所 罗 门 诺 夫 精致 度 和 本 
内 特 逻 辑 深度 的 角度 来 看 ， 这 里 的 运气 成 分 似乎 并 没有 想象 中 那么 大 …… 



























































































































































贝 叶 斯 推断 当然 考虑 了 感知 过 程 : 给 定 模 棱 
两 可 的 输入 ， 我 们 的 大 脑 会 由 此 重新 构建 最 
可 能 的 解释 。 
斯 坦 尼斯 拉 斯 * 德 阿 纳 (1965 一 ) 
贝 叶 斯 学 习 者 可 以 从 一 组 观察 过 的 例子 之 中 
提取 更 大 量 的 关于 某 个 概念 外 延 的 信息 ， 然 
后 以 理性 的 方式 利用 这 些 信息 推断 出 某 个 新 
对 象 作 为 这 个 概念 的 实例 的 概率 是 多 少 。 
乔 希 ， 特 南 鲍 姆 (1972 一 ) 


slO0sz 
贝 叶 斯 大 脑 


大 脑 不 可 思议 


2017 年 9 月 ， 我 觉得 已 经 完成 了 本 书 的 初稿 。 我 将 这 份 初稿 发 给 了 一 位 朋 
友 朱 利安 法 若 ， 他 是 数学 家 。 然 后 朱 利 安 向 我 热情 推荐 了 神经 科学 家 斯 坦 尼 
斯 拉 斯 ， 德 阿 纳 在 法 兰 西 公 学 院 开设 的 一 门 课程 ， 名 为 “做 统计 的 大 脑 : 认 知 
科学 中 的 贝 叶 斯 革命 ”( Le cerveau statisticien: la révolution bayésienne en sciences 
cognitives )。 朱 利安 还 加 上 了 这 么 一 句 :“ 我 觉得 “ 贝 叶 斯 大 脑 ” 值 得 男 开 一 章 。” 
但 是 ， 这 本 书 对 我 来 说 似乎 已 经 太 长 了 。 

但 我 还 是 去 昕 了 斯 坦 尼 斯 拉 斯 * 德 阿 纳 的 课程 ， 那 真是 醒 酬 灌顶 ! 我 花 了 两 
天 看 完了 他 关于 这 个 主题 为 时 两 年 的 课程 一 一 要 不 是 因为 工作 ， 我 花 的 时 间 可 能 
还 会 更 少 ! 在 每 一 课 中 ， 我 就 像 是 发 现 了 新 糖果 的 小 孩子 ， 不 停 研 着 嘴唇 等 着 ! 
更 令 人 吃惊 的 是 ， 虽 然 我 对 贝 叶 斯 主义 有 很 高 的 置信 和 度 ， 其 至 达到 了 狂 信 的 地 步 ， 
但 我 还 是 不 停 地 重复 着 这 人 句 话 :“ 但 是 贝 叶 斯 公式 不 可 能 在 人 类 认 知 中 处 于 这 么 核 
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心 的 地 位 1!” 我 虽然 自 认 为 极端 贝 叶 斯 主义 者 ， 但 我 当时 似乎 还 不 够 贝 叶 斯 ! 

但 仔细 一 想 ， 我 应 该 预料 到 这 一 点 。 如 果 贝 叶 斯 主义 真 的 就 是 最 优 的 学 习 方 
式 的 话 ， 那 么 在 选择 最 能 生存 和 繁衍 的 智慧 物种 时 ， 自 然 选择 就 必定 应 该 同时 选 
择 了 贝 叶 斯 主义 。 这 甚至 就 是 贝 叶 斯 主义 与 达尔 文 式 演化 结合 之 后 能 做 出 的 预言 : 
如 果 贝 叶 斯 公式 真 的 是 所 有 认识 论 误 区 的 解决 办 法 ,那么 自然 母亲 必定 也 找到 了 
实用 的 方法 来 通过 自然 过 程 对 贝 叶 斯 公式 进行 近似 计算 。 果 然 ， 这 个 预言 在 这 十 
几 年 间 被 认 知 科学 一 次 又 一 次 地 证 实 了 ! 我 们 的 大 脑 是 一 个 了 不 起 的 计算 器 ， 能 
对 贝 叶 斯 公式 进行 各 种 各 样 的 近似 计算 。 

这 一 断言 可 能 看 起 来 很 令 人 困惑 ， 毕 竞 这 本 书 用 了 很 长 的 篇 幅 来 批评 ， 我 们 
即使 面 对 蒙 带 . 霍 尔 问题 这 样 的 简单 情况 ， 也 无 法 正确 应 用 贝 叶 斯 公式 。 我 一 直 
在 强调 那 种 阴魂 不 散 的 自信 过 度 ， 它 伴随 着 我 们 在 尝试 理解 贝 叶 斯 主义 时 的 无 能 。 
丹尼尔 . RMS APTE + 特 沃 斯 基 似 乎 也 花 上 了 整个 职业 生涯 来 证 明 这 一 点 。 
的 确 ， 我 们 不 理解 贝 叶 斯 公式 ; 的 确 ， 我 们 不 懂得 怎么 将 它 应 用 在 数学 问题 上 ; 的 
确 ， 我 们 不 善于 用 贝 叶 斯 主义 思考 。 

尽管 如 此 ， 自 然 母亲 并 没有 选择 我 们 思考 抽象 问题 的 能 力 ， 她 选择 的 是 我 们 
适应 环境 的 能 力 。 这 样 的 话 ， 大 脑 进行 的 贝 叶 斯 推断 其 实 是 对 感官 接收 到 的 信息 
进行 的 无 意识 处 理 ， 尤 其 是 因为 对 这 些 数据 的 处 理 可 能 关乎 我 们 在 自然 界 中 的 生 
存 或 者 对 社会 环境 的 理解 。 

“人 类 大 脑 依靠 的 是 演化 而 来 的 古老 能 力 。 我 们 继承 的 那些 能 力 和 直觉 在 过 去 
和 现在 对 我 们 这 个 物种 的 生存 都 至 关 重 要 。 因 此 ， 所 有 婴儿 生来 就 具有 某 种 空间 
概念 和 数字 概念 ， 而 在 人 类 这 个 物种 的 情况 中 ， 还 有 专门 用 于 语言 的 回路 。” 斯坦 
尼斯 拉 斯 . 德 阿 纳 详细 解释 道 ,“ 显 然 ， 教 育 尝试 超越 这 些 知 识 。 教 育 让 我 们 拥有 
新 的 技能 ， 比 如 阅读 、 写 作 、 符 号 化 和 形式 化 的 算术 ， 这 都 是 演化 没有 预见 到 的 。 
但 我 们 会 循环 利用 Conn ) 那些 古老 的 大 脑 系统 来 获取 文化 上 的 新 技能 。 

这 样 的 循环 利用 可 能 有 缺陷 ， 并且 违反 概率 法 则 。 然 而 ， 那 些 通常 处 于 无 意 
识 中 的 已 有 认 知 过 程 及 其 实际 应 用 似乎 惊人 地 吻合 贝 叶 斯 主义 的 计算 。 
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山峰 还 是 山谷 ? 


请 你 打开 一 幅 地 形 图 ， 也 就 是 一 幅 记 录 了 地 形 的 地 图 。 你 可 以 在 智能 手机 上 
打开 地 图 ， 然 后 在 选项 中 激活 “地 形 ” 模 式 。 放 大 某 串 山 弯 或 者 山谷 ， 比 如 沙 葛 尼 
(Chamonix) 山谷 。 现 在 将 地 图 倒 过 来 看 ， 如 果 你 用 的 是 手机 ， 那 就 把 手机 倒 过 来 ， 
但 是 不 要 把 图 像 本 号 也 倒 过 来 。 你 应 该 会 立刻 注意 到 某 种 奇怪 的 现象 (图 19.1 ) …… 














图 19.1 2 "sem 其 中 一 幅 上 下 颠倒 了 。 图 中 表示 的 到 底 是 山峰 还 是 

你 应 该 会 觉得 山峰 好 像 变 成 了 山谷 ， 而 山谷 则 变 成 了 山峰 ! 特别 是 在 地 图 上 ， 
阴影 区 域 的 上 面 似 乎 就 像 是 山峰 ， 而 山谷 就 处 于 阴影 区 域 下 面 。 

但 这 种 感知 从 何 而 来 ? 是 什么 让 我 们 能 够 区 分 地 图 上 的 山谷 和 山峰 ? 

与 许多 无 意识 的 感知 一 样 ， 我 们 得 出 的 结论 其 实 来 自 贝 叶 斯 式 的 计算 。 在 这 
个 例子 中 ， 我 们 对 地 图 的 解释 用 到 的 那个 不 可 或 缺 的 偏见 就 是 照明 的 来 源 。 这 是 
因为 ， 地 图 中 的 阴影 产生 于 来 自 地 图 上 方 的 上 照明， 即使 这 种 照明 在 欧洲 和 美国 等 
北半球 地 区 在 物理 上 是 不 可 能 发 生 的 ， 因 为 太阳 总 会 从 南面 照射 过 来 中 1 

虽然 这 个 偏见 在 地 图 的 情况 中 并 不 正确 ， 但 在 日 常生 活 中 却 完 全 有 根 有 据 。 
无 论 是 阳光 还 是 电灯 ， 照 明 一 般 来 自 上 方 。 所 以 ， 当 我 们 观察 别人 的 面孔 时 ， 我 
们 一 般 会 看 到 鼻子 处 于 一 片 阴 影 的 上 面 ， 而 眼睛 则 相反 ， 处 于 一 片 阴影 的 下 面 。 
此 外 ， 反 方向 的 照明 会 看 起 来 很 惊悚 ， 这 也 解释 了 为 什么 恐怖 电影 中 经 常用 到 从 
下 至 上 的 照明 。 
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一 般 来 说 ,我 们 的 视 皮 层 提 





有 出 色 的 无 意识 能 力 ， 可 以 猿 出 图 像 中 照明 的 来 











源 ， 为 的 是 之 后 能 更 好 地 解释 图 像 中 的 内 容 。 因 此 ， 这 个 过 程 与 之 前 提 到 的 贝 叶 














斯 网 络 和 玻 尔 效 受 机 非常 相似 ， 


到 的 变量 。 








我 们 的 大 脑 似乎 会 立刻 利用 隐藏 变量 来 理解 观察 


关于 照明 的 偏见 会 让 我 们 对 一 幅 上 下 颠倒 的 地 图 做 出 错误 解释 ， 在 我 们 分 析 








自然 世界 的 大 量 图 像 时 ， 这 种 偏见 的 效率 高 得 可 怕 。 然 而 ， 如 果 构 筑 图 像 的 规则 





在 自然 界 中 很 不 常见 的 话 ， 这 些 偏 见 也 会 将 我 们 引 向 尽 途 。 
请 你 拿 两 支 相同 的 笔 , 然后 把 其 中 一 支 横 放 ， 把 男 一 支 竖 直 放 在 前 一 支 上 面 ， 





构成 数学 家 用 来 表示 垂直 的 符号 



































“上 ”。 现 在 看 看 这 两 文笔 ， 你 应 该 会 觉得 竖 着 的 那 





支 笔 要 比 横着 的 更 长 ， 但 根据 这 个 图 形 的 构造 ， 这 两 支 笔 的 长 度 其 实 是 一 样 的 ! 
这 种 视 错 觉 同 样 可 以 利用 我 们 的 贝 叶 斯 大 脑 中 有 赁 有 据 的 俩 见 做 出 完美 的 解 
释 。 我 们 的 大 脑 习惯 于 观看 符合 透视 原则 的 图 像 ， 其 中 看 到 的 竖 线 通常 对 应 着 透 
视 中 的 水 平 线 一 一 铁路 的 铁轨 就 是 一 种 典型 的 情况 。 然 而 ， 在 透视 的 情况 下 ， 这 
些 直线 会 被 压缩 ， 看 起 来 要 比 实际 上 更 短 。 我 们 的 贝 叶 斯 大 脑 因此 会 在 无 意识 中 
将 这 种 关于 透视 的 正确 偏见 纳入 考虑 。 这 就 会 导致 大 脑 推 断 出 竖 线 要 比 看 起 来 更 
长 。 可 能 就 是 出 于 这 个 原因 ， 我 们 会 本 能 地 误 认 为 自己 摆 出 的 垂直 符号 上 中 的 竖 
































线 要 比 横 线 更 长 (图 19.2 ZEE )。 

























































































其 他 视 错 觉 也 用 到 了 这 种 透视 效应 ， 一 个 经 典 例子 就 是 同一 个 人 像 被 复制 粘 
贴 到 前 后 两 个 不 同 的 透视 平面 上 ( 图 19.2 中 图 )。 我 们 会 觉得 处 于 后 面 的 透视 平面 
上 的 人 像 更 大 ， 那 是 因为 我 们 的 贝 叶 斯 大 脑 在 无 意识 中 应 用 了 贝 叶 斯 公式 ( 的 一 
个 近似 )， 以 此 推断 出 后 面 的 透视 平面 上 的 人 像 很 有 可 能 比 看 上 去 更 大 。 这 个 视 错 





























党 可 以 通过 贝 叶 斯 推断 来 解释 。 

































































另 一 个 经 典 视 错觉 与 此 类 似 ， 那 是 其 中 一 部 分 有 阴影 的 国际 象棋 盘 〈 图 19.2 
右 图 )。 阴 影 中 的 白色 格子 看 起 来 比照 明之 下 的 黑色 格子 颜色 更 浅 ， 但 实际 上 并 不 
是 这 样 的 。 虽然 如 此 ， 我 们 的 贝 叶 斯 大 脑 在 无 意识 中 进行 的 贝 叶 斯 推断 也 会 考虑 
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照明 的 效应 ， 由 此 得 到 “有 用 ”的 结论 ， 也 就 是 被 照 亮 的 黑色 格子 的 颜色 比 阴 影 
中 的 白色 格子 更 深 。 
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图 19.2 几 个 经 典 的 视 错觉 。 左 图 中 两 条 线段 的 长 度 相同 ， 中 图 中 的 两 个 小 人 大 小 相同 ， 
右 图 中 的 格子 A 和 B 的 亮度 相同 


& 





运动 的 感知 





取 一 个 非常 扁 的 萎 形 ， 然 后 将 它 倾斜 ,使 其 最 长 的 对 称 轴 基 本 上 沿 着 从 右上 
到 左下 的 对 角 线 ， 再 将 这 个 萎 形 从 左 移 到 右 。 如 果 净 形 与 背景 之 间 的 对 比 度 很 高 
(一 般 会 用 黑色 萎 形 和 白色 背景 )， 那么 我 们 就 会 清楚 地 看 到 获 形 从 左 移 到 右 。 然 
而 奇怪 的 是 ， 如 果 将 对 比 度 降 低 〈 比 如 浅 灰 色 凌 形 和 白色 背景 )， 有 些 神奇 的 事情 
就 会 发 生 。 很 多 人 会 看 到 葡 形 似乎 在 往 右 下 方 移动 。 我 自己 在 Twitter 上 重复 了 这 
个 实验 ， 根 据 我 发 起 的 统计 调查 ， 回 答 问卷 的 376 个 人 中 的 39% 说 看 到 次 形似 乎 
也 有 点 向 下 方 移动 了 ! 

我 们 害 智 的 贝 叶 斯 大 脑 是 怎么 得 出 这 种 错误 结论 的 ?在 一 篇 出 色 的 论文 之 中 久 ， 
魏 斯 、 西 蒙 切 利和 阿 德尔 森 证 明了 这 个 错误 的 结论 正 是 贝 叶 斯 大 脑 在 计算 中 整合 
了 弱 对 比 度 导致 的 不 确定 性 之 后 理应 得 出 的 结论 。 

但 在 介绍 这 三 位 作者 的 贝 叶 斯 式 解 释 之 前 ,我 们 先 来 看 一 项 大 脑 经 常 被 低估 
的 惊人 能 力 : 当 与 背景 颜色 对 比 度 高 的 疤 形 移动 的 时 候 ， 我 们 能 够 确定 它 的 运动 。 
这 真是 项 非 几 的 成 就 ! 毕 竞 从 感官 的 角度 来 看 ， 我 们 看 到 的 所 有 东西 都 只 是 或 明 
或 灭 的 像素 。 视 频 中 像素 亮度 的 改变 是 怎么 被 翻译 为 视频 中 物体 的 运动 的 呢 ? 

我 们 之 前 看 到 ， 我 们 的 大 脑 皮层 首先 能 够 做 到 的 就 是 检测 出 图 像 中 的 线条 。 
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这 样 的 话 ， 当 鞭 形 移动 时 ， 大 脑 明显 会 看 到 次 形 的 边 在 移动 。 但 菱形 的 每 条 边 都 
是 倾斜 的 ， 所 以 ， 当 获 形 从 左 往 右 移 动 时 ， 净 形 的 边 却 似乎 在 往 另 一 个 方向 移动 。 
实际 上 ， 所 有 移动 中 的 线段 都 像 是 在 以 垂直 于 直线 的 方向 往 右边 移动 。 对 于 无 限 
长 的 直线 来 说 ， 这 样 的 移动 其 实 无 法 与 任何 往 右 的 平移 区 分 。 

昌 然 如 此 ， 作 为 优秀 的 贝 叶 斯 “计算 器 "， 我 们 的 大 脑 知道 ， 直 线 以 垂直 于 直 
线 的 方向 往 右 移动 只 不 过 是 直线 往 右 移动 的 其 中 一 种 可 能 的 解释 。 虽 然 在 先 验 上 
这 也 许 是 最 有 可 能 的 移动 方式 ， 但 其 他 移动 方式 的 概率 并 不 为 0。 根据 魏 斯 、 西 蒙 
切 利 和 阿 德尔 森 的 说 法 ， 大 脑 会 结合 萎 形 所 有 边 可 能 的 运动 ， 并 且 假 设 萎 形 本 身 
只 治 一 个 方向 移动 。 也 就 是 说 ， 在 给 定 不 同 边 可 能 的 移动 方式 的 情况 下 ， 大 脑 会 
计算 出 萎 形 在 后 验 中 最 有 可 能 的 移动 方式 。 正 是 这 种 方法 让 大 脑 能 够 从 边 的 移动 
推断 出 菱形 本 身 的 运动 一 一 即使 这 些 边 的 移动 并 不 确定 ! 

这 就 解释 了 为 什么 大 脑 能 在 对 比 度 足够 高 的 情况 下 做 出 正确 的 推断 。 那 么 在 
对 比 度 低 的 情况 下 又 怎么 样 呢 ?在 这 种 情况 下 ， 大 脑 难以 辨识 线条 的 运动 ， 这 些 
线条 移动 的 速度 对 它 而 言 有 某 种 不 确定 性 〈 还 要 加 上 对 于 线条 运动 方向 的 不 确定 
TE), 令 人 惊奇 的 是 ， 这 种 额外 的 不 确定 性 会 导致 贝 叶 斯 式 计算 产生 差异 。 当 不 确 
定性 足够 大 的 时 候 ， 贝 叶 斯 推断 得 出 的 结论 就 会 更 倾向 疤 形 往 右 下 方 移动 这 个 假 
设 ， 也 就 是 说 这 种 移动 方式 是 最 大 的 后 验 估计 。 

真是 难以 置信 ! 大 脑 的 错误 预测 可 以 解释 为 大 脑 的 贝 叶 斯 计算 中 因 引 入 对 比 
度 下 降 带 来 的 额外 不 确定 性 而 得 到 的 结果 ! 这 种 预测 是 错误 的 ， 但 这 种 错误 有 它 
的 理由 ， 因 为 这 就 是 贝 叶 斯 大 脑 在 面 对 不 确定 性 时 最 好 的 处 理 方法 ! 

虽然 我 们 为 这 个 实验 选 定 的 条 件 非常 不 自然 ， 目 的 就 是 欺骗 我 们 的 贝 叶 斯 大 
脑 ， 但 在 实践 中 ， 贝 叶 斯 式 的 预测 通常 可 能 更 为 贴切 ! 











































































































































































































































































































贝 叶 斯 抽样 








认 知 科学 中 最 令 我 印象 深刻 的 现象 之 一 ， 就 是 人 类 大 脑 进行 有 代表 性 的 抽样 
的 能 力 ， 这 一 能 力 可 能 是 通过 我 们 在 第 17 章 中 谈 到 的 MCMC 实现 的 。 我 们 之 前 
也 谈 到 过 ， 抽 样 方法 对 于 概率 性 现象 的 描述 通常 相当 有 效 ， 尤 其 是 当 相 关 的 概率 
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分 布 难以 利用 数学 语言 来 描述 时 。 然 而 ， 在 实践 中 ， 绝 大 部 分 概率 分 布 本 身 难以 
描述 ， 也 难以 直接 处 理 。 

我 们 的 贝 叶 斯 大 脑 似乎 理解 了 这 一 点 。 与 其 像 纯粹 贝 叶 斯 主义 者 那样 同时 利 
用 多 个 互 不 相 容 的 理论 来 得 出 结论 ， 大 脑 更 倾向 于 顺 次 思考 ， 首 先 考 虑 非常 可 信 
的 模型 ， 如 果 还 有 时 间 的 话 ， 然 后 再 考虑 其 他 可 信 模 型 。 

一 般 来 说， 人 们 会 以 这 种 方式 来 尝试 解释 那些 模棱两可 的 图 像 。 你 以 前 可 能 
也 见 过 这 幅 模 楼 两 可 的 图 像 ， 它 从 某 个 角度 看 像 风 子 ， 但 从 另 一 个 角度 看 却 像 免 
子 (图 19.3 )。 最 奇怪 的 是 ， 我 们 似乎 不 可 能 同时 看 到 这 幅 图 像 的 两 种 解释 方式 。 
我 们 的 贝 叶 斯 大 脑 似乎 一 次 只 能 观察 到 其 中 一 种 解释 ! 


























19.3 REYR ie $8? 


在 2011 年 ， 莫 雷诺 - 博 特 、 尼 尔 和 普 热 研究 了 这 一 现象 局 。 他 们 让 被 试 观看 
两 个 黑色 网 格 在 白色 背景 上 相对 移动 的 情景 ， 然 后 询问 被 试 哪 一 个 网 格 在 上 。 被 
试 在 两 种 可 能 的 解释 之 间 播 摆 不 定 。 贝 叶 斯 大 脑 假设 指出 ， 在 这 种 情况 下 ， 被 试 
采用 某 种 解释 的 时 间 比 例 就 是 被 坛 对 于 这 一 解释 的 贝 叶 斯 置信 和 度 。 

为 了 测试 这 一 假设 ， 这 三 位 研究 者 的 天 才 想 法 就 是 先 研究 两 个 不 同 的 变量 对 
于 被 试 在 不 同 解释 上 花费 的 时 间 有 什么 影响 ， 然 后 验证 两 个 变量 的 县 加 影响 正 是 
各 自 影 响 的 乘积 。 他 们 研究 的 这 两 个 变量 就 是 其 中 一 个 网 格 的 直线 密度 与 相对 速 
度 。 令 人 吃惊 的 是 ， 将 贝 叶 斯 大 脑 假设 所 预言 的 效应 相 乘 之 后 ， 正 好 完美 符合 两 
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种 效应 的 实际 对 加 效果 %1 贝 叶 斯 大 脑 进行 的 抽样 似乎 恰好 遵循 概率 法 则 ! 更 神奇 
的 是 ,王公 发 (音译) 和 汪 小 京 外 确定 了 可 能 与 此 相关 的 神经 机 制 ， 可 以 具体 解 
释 神 经 元 进行 这 类 贝 叶 斯 抽样 的 能 力 ! 

这 一 结论 有 个 奇怪 的 推论 : 如 果 利用 各 种 不 同 解释 来 进行 多 次 预测 的 话 ， 那 么 
我 们 就 能 得 到 更 好 的 预测 结果 。 你 可 能 还 记得 ， 纯 粹 贝 叶 斯 主义 者 会 通过 取 不 同 
可 信 模 型 的 预测 的 加 权 平 均 来 优化 自己 的 预测 。 为 了 测试 中叶 斯 大 脑 利 用 MCMC 
进行 预测 这 一 假设 的 推论 ， 武 尔 和 帕 什 勒 是 向 428 位 被 试 提 出 了 下 面 的 问题 : “全 
世界 的 机 场 有 百 分 之 几 位 于 美国 ?” 他 们 要 求 被 试 给 出 两 个 答案 。 第 二 个 答案 通常 
比 第 一 个 答案 更 不 准确 ， 但 令 人 惊异 的 是 ， 尽 管 如 此 ， 这 两 个 答案 的 平均 值 却 明 
显 比 其 中 较 准 确 的 那个 答案 更 准确 ! 

更 妙 的 是 ， 对 于 其 中 一 半 被 试 ， 武 尔 和 帕 什 蔓 等 了 三 个 星期 才 让 他 们 给 出 第 
二 个 答案 ,这 让 被 试 在 第 二 次 回答 之 前 有 机 会 真正 改变 对 问题 的 诠释 。 猜 猜 发 生 
了 什么 ? 这 时 ， 答 案 的 平均 值 变 得 比 紧 接 着 第 一 次 回答 给 出 第 二 个 答案 的 情况 更 
准确 了 。 德 阿 纳 这 样 总 结 道 : “将 同一 个 问题 问 上 两 遍 也 不 错 。 












































































































































归纳 问题 


2011 4E, jr - 特 南 鲍 姆 和 三 位 合作 者 日 在 英语 中 引入 了 一 个 新 的 词 
“tufa”。 为 了 解释 这 个 概念 是 什么 ， 特 南 鲍 姆 给 出 了 3 张 “tufa” 的 例 图 。 我 们 之 
中 的 那些 纯粹 主义 者 自然 会 说 ， 这 种 定义 新 概念 的 方法 真 的 非常 糟糕 。 

尽管 如 此 ， 这 四 位 研究 者 观察 到 ， 在 只 有 3 个 “tufa” 的 例子 ， 而 且 没有 任何 
不 是 “tufa” 的 范例 的 情况 下 ， 我 们 仍然 能 够 基本 上 对 “tufa” 到 底 是 什么 达成 一 
致 。 实 际 上 ， 特 南 鲍 姆 之 后 给 出 了 39 张 图 片 ， 对 大 家 来 说 ， 其 中 6 张 图 片 似乎 显 
然 就 是 “tufa”， 而 其 余 的 图 像 都 不 是 “tufa”! 实在 难以 置信 |! 

这 种 惊人 的 现象 有 时 候 也 被 称 为 归纳 问题 。 它 当然 远 远 达 不 到 p 值 以 及 费 希 
尔 的 各 种 方法 的 标准 ， 然 而 ， 据 特 南 鲍 姆 及 其 合作 者 所 说 ， 这 种 现象 可 以 完美 地 






































(D 这 建立 在 一 些 独立 于 效应 的 假设 上 。 
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用 贝 叶 斯 原则 来 解释 ， 只 需要 从 ““tufa” 的 3 个 例子 对 “tufa” 具 有 代表 性 ”这 一 
偏见 出 发 ,然后 假设 与 这 些 例子 不 够 相似 的 例子 就 不 是 “tufa”"， 这 样 就 解释 得 通 
了 。 更 妙 的 是 ， 通 过 例子 学 习 似乎 正 是 我 们 学 习 词汇 意义 的 真正 方式 。 我 们 从 来 
没 昕 过 “ 猫 ” 的 形式 定义 ， 只 是 看 过 类 似 的 形状 ， 然 后 父母 告诉 我 们 ， 大 家 把 它 
MIYE “Ai” o 

归纳 问题 的 一 个 简单 但 有 说 服 力 的 解释 ， 就 是 从 先 验 上 假设 所 有 事物 组 成 的 
集合 构成 了 树 的 结构 ， 就 像 生命 演化 树 那 样 。 这 样 的 话 ， 当 且 仅 当 某 个 定义 与 树 
的 结构 相 容 ， 也 就 是 它 必 须 对 应 于 树 的 一 个 结 点 时 ， 它 是 可 以 接受 的 。 这 也 是 系 
统 发 生 学 所 用 的 方法 ， 这 门 学 科 会 将 哺乳 动物 等 物种 类 群 定义 为 拥有 某 个 共同 祖 
先 的 所 有 派生 物种 。 所 有 可 能 的 定义 也 就 组 成 了 演化 树 上 所 有 结 点 的 集合 。 

我 们 知道 ,“tufa” 必 定 是 这 棵 树 上 的 一 个 结 点 ， 接 下 来 要 做 的 就 是 确定 它 到 
底 是 哪个 结 点 。 特 南 鲍 姆 与 合作 者 提出 可 以 研究 简化 的 情况 ， 其 中 所 有 结 点 的 先 
验 概率 都 相同 。 那 么 MAP 模型 就 是 似 然 度 最 大 的 模型 ， 也 就 是 使 得 特 南 鲍 姆 的 3 
个 例子 属于 “tufa” 的 概率 最 大 的 定义 。 通 过 非常 简单 的 计算 就 能 看 出 ， 那 就 是 包 
含 所 有 例子 但 又 最 远离 树 根 的 那个 结 点 。 

特 南 鲍 姆 及 其 合作 者 提出 ， 正 是 借助 类 似 的 计算 ， 我们 仅仅 通过 3 个 例子 就 
能 对 “tufa” 一 词 的 意义 达成 共识 。 他 们 还 推测 ， 在 更 普遍 的 情况 中 ,婴儿 也 是 这 
样 学 会 语言 中 的 词汇 的 。 




























































































但 这 个 解释 似乎 相当 不 完善 。 人 们 也 许 会 问 ， 大 脑 是 如 何 确定 那 棵 对 所 有 事 
物 分 类 的 树 的 ? 此 外 ， 树 这 个 结构 从 何 而 来 ” 特 南 饱 姆 与 合作 者 的 回答 令 人 着 迷 : 
对 树 结构 的 必要 性 的 学 习 ， 以 及 对 事物 分 类 的 树 结 构 的 学 习 ， 似 乎 都 是 层次 贝 叶 
斯 计算 的 推论 。 也 就 是 说 ， 大 脑 似乎 进行 的 是 层次 贝 叶 斯 计算 。 
要 理解 这 一 点 ， 请 想象 一 下 又 圆 又 重 的 物体 A、 又 圆 又 非常 重 的 物体 B、 非 
常 圆 但 只 是 一 般 重 的 物体 C， 然 后 有 人 跟 你 说 ,物体 A HRKI “tufa” EFE. 


你 能 够 将 这 个 结论 推广 到 物体 B 和 物体 C 上 吗 ? 而 如 果 你 手头 上 只 有 物体 B 和 物 
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体 C， 你 应 该 用 哪 一 个 物体 来 豪 调 “tufa” 呢 ? 

要 回答 这 个 问题 ， 我 们 就 必须 知道 ， 对 于 豪 调 “tufa” 来 说 ,物体 的 圆 度 是 不 
是 比 它 的 重量 更 重要 ， 以 及 圆 度 和 重量 的 变化 在 什么 程度 上 会 影响 “tufa” 的 毫 
调 。 然 后 ， 层 次 贝 叶 斯 计算 就 会 利用 其 他 类 似 的 例子 作为 启发 ， 比 如 说 ， 在 豪 调 
其 他 食物 时 用 到 的 物体 的 圆 度 和 重量 的 影响 。 

这 正 是 我 们 在 解决 斯 坦 悖 论 时 用 到 的 方法 。 回 忆 一 下 ， 为 了 根据 相关 数据 判 
断 某 位 飞行 员 的 水 平 ， 同 时 考虑 其 他 飞行 员 的 水 平 也 不 无 次 处。 同样 ， 这 个 原则 
在 解决 苏格兰 绵羊 问题 时 也 至 关 重要 。 为 了 将 一 只 绵羊 的 黑色 毛色 推广 到 其 他 绵 
羊 ， 关 于 其 他 物种 的 毛色 如 何 根据 地 理 环境 变化 的 知识 也 有 用 处 。 

最 迷人 的 地 方 在 于 ， 这 种 层次 贝 叶 斯 主义 的 做 法 可 以 被 视 为 一 种 学 习 “ 如 何 
学 习 ” 的 方法 。 在 学 习 到 圆 度 和 重量 一 般 会 对 襄 儿 有 什么 影响 之 后 ， 我 们 就 能 更 
有 效 地 确定 物体 B 和 物体 C 在 豪 调 “tufa” 时 用 处 有 和 多大， 即使 我 们 得 到 的 唯一 
信息 只 与 物体 A 有 关 ! 层次 学 习 让 我 们 能 够 忽略 那些 无 关 紧要 的 变量 ， 专 注 于 那 
些 重要 的 变量 。 

当然 ,我 在 这 里 给 出 的 只 是 一 个 极端 简化 的 例子 。 但 在 更 普遍 的 情况 中 ， 层 
次 贝 叶 斯 方法 能 够 迅速 确定 用 什么 方式 才能 将 有 关 世 界 的 模型 正确 地 组 织 起 来 ， 
比如 对 物体 分 类 时 用 到 的 图 结构 的 选择 ， 或 者 研究 物理 现象 时 用 到 的 因果 法 则 。 
一 旦 发 现 了 这 些 模 型 的 正确 结构 ， 学 习 过 程 就 能 大 大 加 速 ， 因 为 之 后 的 学 习 可 以 
在 恰当 的 受 限 模型 中 进行 。 

其 实 我 们 已 经 看 到 了 这 种 学 习 的 一 个 更 明确 的 例子 ， 那 就 是 LDA。 这 个 贝 叶 
斯 结构 能 让 我 们 逐步 学 会 在 为 文件 分 类 时 选择 合适 、 贴 切 的 类 别 ， 也 会 让 日 后 的 
文件 分 类 变 得 更 简单 。 此 外 ， 这 个 模型 也 与 特 南 鲍 姆 和 其 他 合作 者 在 2011 年 研究 
过 的 模型 中 很 相似 ， 他 们 得 出 的 结论 就 是 所 谓 的 “抽象 的 恩赐 ”。 
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特 南 鲍 姆 及 其 合作 者 用 下 面 的 方法 展示 了 这 种 抽象 的 恩赐 。 他 们 首先 考虑 了 
一 个 层次 结构 ， 换 句 话 说， 他们 考虑 了 多 个 一 般 性 的 模型 ， 其 中 每 一 个 模型 都 可 
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以 分 为 不 同 的 特殊 因果 模型 ， 而 这 些 模 型 又 可 以 细 分 为 不 同 的 特殊 情况 。 然 后 ， 
他 们 考虑 了 一 个 贝 叶 斯 人 工 智能 ， 它 会 在 这 个 层次 结构 中 的 每 一 个 层次 都 应 用 贝 
叶 斯 公式 进行 计算 。 

所 罗 门 诺 夫 归纳 法 可 以 很 好 地 解释 这 种 做 法 。 回 忆 一 下 ， 所 罗 门 诺 夫 的 做 法 
就 是 学 习 那 些 能 够 解释 过 往 数据 并 预测 此 后 数据 的 理论 。 我 们 可 以 打赌 ， 最 优秀 
的 理论 就 是 那些 利用 贝 叶 斯 公式 从 过 去 数据 出 发 做 出 预测 的 理论 。 所 罗 门 诺 夫 妖 
在 理论 之 间 进 行 的 贝 叶 斯 计算 很 可 能 会 将 置信 度 放 在 那些 符合 贝 叶 斯 主义 的 理论 
上 ， 而 这 些 理论 也 会 将 贝 叶 斯 公式 应 用 到 下 一 层 上 。 更 进一步 ， 这些 贝 叶 斯 理论 
会 研究 众多 子 理论 ， 最 终 会 偏好 那些 符合 贝 叶 斯 主义 的 子 理论 ， 以 此 类 推 。 

无 论 如 何 ， 特 南 鲍 姆 及 其 合作 者 进行 的 模拟 指出 ， 层 次 贝 叶 斯 学 习 一 开始 在 
所 有 层次 上 都 很 缓慢 ,但 在 研究 几 百 到 数 千 个 抽样 之 后 ， 整 个 层次 结构 最 终 会 将 
贝 叶 斯 置信 度 放 在 正确 的 一 般 性 理论 之 中 。 令 人 感 兴趣 的 是 ， 对 正确 的 一 般 性 理 
论 的 学 习 要 比 更 低层 次 的 学 习 快 得 多 。 这 个 观察 结果 的 推论 之 一 ， 就 是 直接 从 正 
确 的 一 般 性 理论 开始 学 习 ， 基 本 上 不 会 节省 多 少时 间 ! 

我 们 之 后 也 会 重新 谈 到 一 个 现象 : 儿童 有 着 强大 的 学 习 能 力 ， 使 某 些 心理 学 
家 惊奇 不 已 ， 他 们 甚至 提出 儿童 大 脑 中 有 着 大 量 由 遗传 信息 预先 编码 的 模型 。 比 
如 说 ， 儿 童 似 乎 有 着 应 用 因果 法 则 的 天 性 。 然 而 特 南 鲍 姆 及 其 同事 进行 的 模拟 指 
出 ， 对 于 利用 层次 贝 叶 斯 主义 的 智能 来 说 ， 学 习 模 型 中 一 般 性 原则 的 速度 其 实 相 
对 较 快 ， 它 们 无 须 预 先 处 理 好 的 学 习 模 型 。 贝 叶 斯 主义 似乎 能 让 智能 以 出 人 意料 
的 效率 来 发 现 贴 合 这 个 世界 的 思考 范式 ! 

某 些 理论 研究 者 有 时 候 会 抱怨 ， 科 学 研究 中 对 人 工 智 能 的 使 用 过 于 泛滥 。 他 
们 称 ， 对 大 数据 的 探索 不 可 能 让 我 们 发 现 优雅 普 适 的 公式 ， 也 不 能 让 我 们 找到 如 
爱 因 斯 坦 的 广义 相对 论 那样 美妙 的 公式 。 机 器 学 习 似 乎 过 于 机 械 ， 欠 缺 只 有 伟大 
的 心灵 才 拥有 的 那 种 才气 。 

然而 ， 这 种 说 法 忽略 了 贝 叶 斯 方法 中 抽象 的 恩赐 。 层 次 贝 叶 斯 方法 似乎 完全 能 
够 从 大 量 理论 的 一 般 结构 之 中 分 辨 出 最 能 对 经 验 数 据 做 出 适当 解释 的 结构 。 它 似 
乎 也 能 够 辨别 出 最 优秀 的 理论 的 一 般 形式 ， 由 此 为 思考 经 验 数 据 给 出 合适 的 范式 。 

如 果 优 雅 的 公式 就 是 对 这 些 数据 建 模 的 正确 方法 ， 那 么 我 们 可 以 打赌 ,足够 
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接近 所 罗 门 诺 夫 妖 的 人 工 智能 必定 知道 如 何 得 出 这 个 公式 ， 正 如 神经 科学 家 发 现 ， 
贝 叶 斯 框架 对 于 研究 认 知 过 程 来 说 非常 贴切 。 














婴儿 都 是 天 才 

















我 们 之 前 看 到 ， 图 灵 将 儿童 的 大 脑 比 作 一 本 记事 本 ， 其 中 “没什么 机 关 ， 但 
有 许多 张 白 纸 ”"。 这 个 理念 长 期 以 来 占据 主流 。 然 而 ， 这 种 想法 被 心理 学 家 史 带 
文平 克 和 现代 神经 科学 打破 ， 贝 叶 斯 主义 对 此 也 有 所 贡献 。 

在 谈 这 个 问题 之 前 ， 我 们 注意 到 ， 即 使 是 不 满 1 岁 的 婴儿 也 已 经 拥有 一 组 所 
谓 的 “核心 知识 ”( core knowledge )， 对 物体 、 数 字 、 空 间 和 语法 都 有 着 某 种 直觉 
上 的 理解 。 除 此 之 外 ， 这 些 婴 儿 似 乎 已 经 具有 统计 能 力 ， 一 般 会 花 很 长 时 间 好 奇 
地 盯 着 他 们 的 贝 叶 斯 大 脑 认为 不 太 可 能 发 生 的 事件 。 

在 2008 年 ， 徐 绯 和 加 西亚 外 对 8 个 月 大 的 婴儿 进行 实验 ， 证实 了 这 一 点 。 这 
个 实验 的 灵感 来 自 拉 普 拉 斯 瓶子 模型 。 一 个 瓶子 里 装着 大 量 小 球 ， 这 些小 球 要 侵 
是 红色 的 ， 要 么 是 白色 的 。 然 后 我 们 从 中 抽出 5 个 小 球 ， 假 设 其 中 有 4 个 红 球 和 1 
个 白 球 。 第 6 章 谈 到 过 的 拉 普 拉 斯 接续 法 则 会 提示 我 们 ， 瓶 子 中 红 球 所 占 的 比例 
大 概 是 (4+1)/(5+2)=5/7。 

然后 ， 我 们 清点 瓶子 里 的 小 球 。 如 果 瓶 子 里 大 部 分 是 红 球 的 话 ， 婴 儿 一 点 都 
ANDR 然而 ， 如 果 瓶 子 里 实际 上 大 部 分 是 白 球 的 话 ， 婴 儿 就 会 花 上 很 长 时 间 上 时 
着 瓶子 ， 好 像 里 边 藏 着 什么 秘密 似 的 。 真 是 难以 置信 ! 8 个 月 大 的 婴儿 似乎 已 经 
能 够 从 直觉 上 把 握 拉 普 拉 斯 的 贝 叶 斯 式 计 算 ， 并 且 就 像 科学 家 那样 ， 会 去 调查 那 
些 贝 叶 斯 的 预测 被 观察 结果 和 否定 的 情况 ! 
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婴 幼 儿 最 令 人 惊异 的 学 习 过 程 就 是 语言 的 学 习 。 人 人 对 此 都 有 经 验 。 即 使 经 
过 数 十 年 的 学 习 ， 黄 至 在 国外 浸 淫 多 年 ， 要 把 一 门 语言 说 得 像 本 地 人 一 样 也 是 非 
常 困 难 的 。 旅 居 英 语 国家 的 法 国人 仍然 会 保留 他 们 的 法 国 口 音 。 与 之 相反 ， 婴 
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幼儿 有 着 从 父母 那里 学 习 语 言 的 惊人 能 力 。 仪 需 数 年 ， 婴 幼儿 对 一 门 语言 的 掌握 
程度 就 能 达到 许多 外 国人 终 其 一 生 都 达 不 到 的 水 平 。 两 岁 孩 子 的 词汇 量 会 以 每 天 
10-20 个 词语 的 疯狂 速度 增长 ! 他 们 是 怎么 做 到 的 ? 

神经 科学 指出 ， 婴 幼儿 的 语言 学 习 可 能 强烈 依赖 于 对 语言 中 被 称 为 “ 音 位 ” 
的 基本 语音 单位 的 统计 性 质 的 考察 。 例 如 ， 在 扎 弗 兰 、 阿 斯 林 和 纽 波 特 进行 的 实 
验 外 中 ,他 们 让 婴 幼 儿 聆 昕 一 连 串 音节 ， 这 些 音节 的 播放 节奏 恒定 ， 以 至 于 不 可 
能 从 中 推断 出 那些 音节 的 任何 信息 。 然 而 ， 在 这 一 连 串 的 音节 背后 隐藏 着 某 种 统 
计 规 律 。 比 如 说 ,“to” 这 个 音节 后 面 跟着 的 一 定 是 “ki”， 而 只 有 在 三 分 之 一 的 情 
况 下 “bu” 后 面 才 会 跟着 “gi”。 这 就 是 一 个 马尔 可 夫 链 NO, 

令 人 震惊 的 是 ， 婴 幼儿 似乎 除了 能 够 辨别 这 些 统计 规律 以 外 ， 甚 至 还 能 够 确 
定 有 可 能 作为 单词 分 界 的 音节 划分 方式 ， 这 大 概 是 通过 贝 叶 斯 推断 做 到 的 。 也 就 
是 说 ， 要 从 口语 中 学 习 单 词 的 话 ， 似 乎 必须 进行 某 种 贝 叶 斯 计算 。 然 后 ， 婴 幼儿 
能 够 将 单词 结合 起 来 ， 以 此 区 分 句子 。 这 是 一 项 非凡 的 成 就 ! 因为 要 做 到 这 一 点 
的 话 ， 婴 幼儿 就 必须 能 够 辨别 句子 的 语法 结构 ， 也 就 是 识别 出 其 中 某 些 词语 是 动 
词 ， 而 另 一 些 词语 则 是 名 词 。 在 某 些 语言 中 ， 婴 幼儿 还 必须 学 会 在 问 句 中 把 词语 
顺序 反 过 来 。 然 而 ， 这 些 在 学 习 语 名 的 构建 中 必 不 可 少 的 努力 ， 对 于 单词 学 习 来 
说 也 有 很 大 的 用 处 。 

我 举 个 例子 解释 一 下 。 假 设 桌 子 上 有 两 个 硫 ， 一 个 是 蓝 色 的 ， 另 一 个 是 镀铬 
的 。 父 母 让 孩子 把 镀铬 的 碗 拿 来 。 孩 子 不 知道 “镀铬 ”是 什么 意思 ， 但 是 他 知道 
这 是 一 个 用 来 描述 克 的 形容 词 。 此 外 ， 孩 子 还 会 猜想 父母 说 的 可 能 不 是 那个 蓝 色 
的 硫 ， 和 否则 父母 可 能 就 会 说 “ 蓝 色 的 硫 ” 了 。 因 此 ， 孩 子 得 出 结论 ， 镀 铬 的 磺 应 
该 不 是 那个 蓝 色 的 硫 ， 而 “镀铬 ”这 个 词 形容 的 就 是 那个 镀铬 的 碗 的 颜色 。 

真是 不 可 思议 ! 这 个 孩子 刚刚 在 没有 数据 的 情况 下 预测 并 学 习 了 “镀铬 ”这 
个 词 的 含义 ， 昌 然 他 之 前 从 来 没有 听 过 这 个 词语 ， 但 他 仍然 确定 了 词语 的 意义 。 
孩子 的 天 才 之 处 就 是 依靠 自身 的 偏见 。 跟 所 罗 门 诺 夫 所 说 的 一 样 : “没有 数据 也 能 
预测 ， 但 没有 先 验 概率 就 不 可 能 预测 。 
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学 习 计 数 


当 孩 子 学 习 字母 表 或 者 数字 的 时 候 ， 他 们 记 住 了 一 连 串 词语 或 者 声音 。 此 外 ， 
学 习 字母 表 通 常 也 伴随 着 一 段 玫 助 记忆 的 旋律 。 学 习 数字 有 时 候 也 会 伴随 着 数 手 
指 的 行为 。 

然而 ,认识 一 串 词 语 并 把 它 熟 记 于 心 ， 并 不 代表 能 够 在 其 他 情况 中 恰当 使 用 
这 些 词语 。 很 多 小 孩子 的 确 能 够 背诵 那些 数字 ， 但 如 果 有 人 让 他 们 找 来 3 个 物体 ， 
他 们 却 会 拿 来 一 堆 东 西 ， 而 不 是 只 拿 3 个 。 

更 奇妙 的 是 ， 和 孩子 一 开始 只 会 理解 “一 ”这 个 词语 的 概念 ， 然 后 他 们 会 学 会 
二 ”这 个 词语 ,但 这 一 过 程 就 到 此 为 止 了 。 在 之 后 儿 个 月 中 ， 即 使 他 们 能 够 背诵 
“一 ”和 “二 ”以 外 的 数字 ， 他 们 都 只 知道 这 两 个 数字 的 意义 。 之 后 他 们 会 学 会 
”， 然 后 又 止步 于 此 。 
大 概 在 三 岁 半 的 时 候 ， 孩 子 似乎 一 下 子 就 完成 了 一 项 概念 上 的 巨大 飞跃 ， 能 
够 将 数字 的 序列 与 数字 的 意义 对 应 起 来 。 他 们 建立 了 “加 上 一 个 额外 的 物体 ”和 
“ 换 用 序列 中 的 下 一 个 数字 ”之 间 的 联系 。 这 种 联系 是 如 何 建 立 起 来 的 呢 ? 

根据 特 南 鲍 姆 及 其 合作 者 皮 安 塔 多 西 和 十 德 曼 所 说 中 ， 孩 子 刚 刚 完成 的 这 
奇妙 壮举 就 是 学 会 了 一 个 递归 算法 。 这 个 算法 以 任意 一 堆 物 体 为 输入 。 如 果 集 合 
中 什么 都 没 剩 下 ， 那 么 算法 就 会 以 最 后 一 个 数 作为 输出 的 结论 。 和 否则 ， 算 法 会 从 
这 堆 物 体 之 中 抽出 一 个 ， 然 后 说 出 数字 序列 之 中 的 下 一 个 数字 一 一 如 果 抽 出 的 是 
第 一 个 物体 ， 那 么 孩子 会 说 “一 ”， 然 后 算法 会 记 住 前 一 步 说 出 来 的 数字 ， 接 着 数 
剩 下 的 物体 。 

我 在 这 里 用 了 抽象 的 说 法 ， 描 述 的 正 是 你 所 知道 的 〈 字 面 意义 上 的 ) 数 手指 
算法 ， 你 每 次 挨个 数 一 堆 东西 的 时 候 应 用 的 就 是 这 个 算法 。 但 这 个 人 人 都 将 学 会 
的 算法 其 实 抽象 得 惊人 ， 而 最 惊人 的 还 是 ， 只 能 通过 统计 学 习 的 小 孩子 能 够 辨别 
并 选择 这 个 抽象 的 递归 算法 。 

德 阿 纳 指出 ， 这 种 思考 并 利用 递归 算法 的 能 力 可 能 就 是 人 类 与 动物 的 大 脑 之 
间 的 根本 性 差异 。 无 论 如 何 ， 这 项 利用 贝 叶 斯 主义 对 递归 算法 进行 的 研究 ， 尤 其 
暗示 了 我 们 的 贝 叶 斯 大 脑 可 能 跟 所 罗 门 诺 夫 妖 之 间 没 有 那么 大 的 差距 。 
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心智 理论 











我 们 的 贝 叶 斯 大 脑 在 儿童 时 期 学 习 到 的 最 基础 的 能 力 之 一 就 是 心智 理论 ， 也 就 
是 思考 其 他 人 正在 思考 什么 的 能 力 ， 以 及 利用 对 他 人 的 思考 建立 的 模型 来 建立 预测 
或 者 学 习 新 概念 的 能 力 。 因 此 ， 孩 子 甚至 在 不 到 两 岁 的 时 候 就 能 够 跟随 别人 的 目光 ， 
模仿 别人 的 动作 ， 甚 至 辨认 出 未 完成 的 动作 的 意图 。 再 大 一 点 时 ， 孩 子 就 会 学 习 到 
对 方 的 信念 并 不 一 定 与 第 三 者 的 信念 完全 相同 ， 以 及 别人 可 能 会 说 谎 ， 或 者 用 反讽 、 
挖苦 、 幽 默 的 语气 说 一 些 话 里 有 话 的 东西 ， 而 且 别 人 还 会 不 自觉 做 出 各 种 动作 。 也 
许 正 因为 我 们 是 社交 性 的 动物 ， 所 以 心智 理论 对 于 我 们 的 学 习 来 说 必 不 可 少 。 

假设 有 一 个 透明 的 瓶子 ， 里边 装着 许多 蓝 色 玩 具 ， 以 及 寥寥 几 个 相似 的 黄色 
玩具 。 一 位 成 年 人 将 手 伸 进 瓶子 中 ， 拿 出 了 3 个 蓝 色 玩 具 ， 然 后 按压 其 中 的 每 一 
个 ， 每 一 个 玩具 都 发 出 了 声音 。 然 后 成 年 人 从 瓶子 里 拿 出 一 个 黄色 玩具 交 给 孩子 。 
我 们 要 提出 的 问题 就 是 ， 目 睹 整个 情景 的 孩子 会 不 会 将 蓝 色 玩 具 发 出 声音 的 能 力 
推广 到 黄色 玩具 上 ? 答案 是 肯定 的 。 孩 子 会 按压 黄色 玩具 大 概 3 K, MARAR 
出 声音 ， 这 时 孩子 才 放 弃 继续 尝试 。 

到 此 为 止 , 事情 还 在 意料 之 中 。 但 这 个 实验 的 如 下 变 体 却 相当 好 玩 儿 : 瓶子 
里 只 有 几 个 蓝 色 玩具 ， 却 有 一 大 堆 黄色 玩具 ， 而 这 一 次 ， 成 年 人 取出 了 3 TEE 
玩具 ， 也 展示 了 按压 这 些 玩 具 就 会 发 出 声音 。 然 后 成 年 人 取出 一 个 黄色 玩具 ， 孩 
子 会 不 会 认为 这 个 黄色 玩具 也 会 发 出 声音 呢 ? 奇怪 的 是 ， 孩 子 的 确 会 去 试 坛 这 个 
玩具 ， 但 现在 却 只 会 尝试 一 次 ! 

所 以 ， 在 第 二 种 实验 中 ， 孩 子 似乎 会 意识 到 成 年 人 的 抽样 有 偏差 。 孩 子 可 能 
会 觉得 成 年 人 故意 只 取出 蓝 色 玩具 ， 因 为 它们 与 黄色 玩具 的 差别 非常 大 。 孩 子 理 
解 了 选择 偏差 的 存在 ， 而 他 们 通过 贝 叶 斯 计算 得 出 结论 ， 蓝 色 玩 具 的 性 质 并 不 一 
定 适 用 于 黄色 玩具 ! 
孩子 不 仅 知 道 如 何 确 定 选择 俩 差 会 怎样 影响 观察 结果 的 泛 化 ,( 我 们 成 年 人 在 
更 抽象 的 情况 中 却 完全 没有 这 种 智慧 ! ) 而 且 他 们 也 知道 为 了 做 到 这 一 点 应 该 如 何 
对 成 年 人 的 想法 建 模 。 孩 子 拥有 心智 理论 ， 而 且 知 道 怎 么 应 用 心智 理论 避免 做 出 


错误 的 结论 。 
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先天 还 是 后 天 ? 

















德 阿 纳 谈 到 了 “神经 科学 中 的 贝 叶 斯 革命 "， 不 仅 因 为 贝 叶 斯 大 脑 的 理论 容纳 
了 难以 用 其 他 方法 解释 的 海量 实验 结果 ， 贝 叶 斯 观点 的 魔力 同样 在 于 它 能 够 解答 


























与 儿童 学 习 过 程 有 关 的 古老 辩论 之 一 ， 而 且 这 个 解答 完整 得 惊人 。 在 这 一 历 




















bu: 


久 的 辩论 中 ， 对 阵 双 方 分 别 是 认为 大 脑 在 出 生 时 就 有 关于 语言 和 语法 的 先 验 知识 
的 先天 论 Cinnatism ) 支持 者 ， 以 及 认为 所 有 这 些 知 识 都 要 经 过 学 习 才 能 获得 的 经 
IW (empiricism) 支持 者 。 这 场 辩论 的 象征 就 是 心理 学 家 斯 金 纳 和 乔 姆 斯 基 之 间 
































史诗 般 的 对 抗 。 








拉 开 战 幕 的 是 伯 勒 斯 " 斯 金 纳 在 1958 年 出 版 的 著作 《语言 行为 》( Verbal 




















Behavior )。 斯 金 纳 以 他 所 做 的 一 些 实验 为 重要 论据 ， 证 明了 饮 子 能 够 学 会 “ 

















» 


和 “转圈 ”等 词 "。 的 确 ， 斯 金 纳 发 现 ， 如 果 在 铝 子 做 出 与 展示 给 它们 的 词语 相关 
的 行动 时 给 它们 奖励 的 话 ， 那 么 这 些 包子 最 后 都 能 理解 这 些 词语 的 意义 ,或 者 至 








少 说 ， 它 们 可 以 将 看 到 的 词语 联系 到 能 获得 奖励 的 行动 上 。 








然而 诺 姆 . 乔 姆 斯 基 反 驳 道 ， 掌 握 人 类 语言 远 比 学 会 词语 与 事件 之 间 的 相关 
性 更 复杂 、 更 困难 。 乔 姆 斯 基 认 为 ， 要 学 会 语言 和 语法 的 精细 复杂 之 处 ， 就 必须 
借助 具有 这 一 潜能 的 大 脑 。 乔 姆 斯 基 提出 ， 我 们 的 大 脑 从 基因 层面 上 就 编 信 了 理 





















































解 和 操作 他 所 谓 的 “普遍 语法 ”的 能 力 。 








然而 ,我 们 之 前 已 经 看 到 ， 贝 叶 斯 大 脑 这 个 假设 有 着 难以 置信 的 预测 能 力 ， 
而 根据 这 一 假设 ， 所 有 婴儿 都 首先 应 该 具有 这 样 的 能 力 ， 能 够 建立 与 环境 中 各 种 
现象 相关 的 复杂 模型 ， 也 能 够 应 用 贝 叶 斯 公式 来 保留 并 探索 那些 最 有 用 的 模型 。 
关键 在 于 ， 特 南 鲍 姆 及 其 合作 者 进行 的 模拟 暗示 了 婴儿 的 这 一 能 力 对 于 建立 周转 
环境 的 模型 、 理 解 语言 和 学 习 说 话 来 说 似乎 是 充分 上 且 必 要 的 条 件 一 一 这 也 印证 了 





























所 罗 门 诺 夫 完备 性 定理 ! 


从 某 种 意义 上 来 说 ， 婴 儿 大 脑 天 生 的 结构 给 主张 人 类 大 脑 必然 具有 某 种 裹 赋 
的 先天 论 提 供 了 论据 。 然 而 ， 这 种 先天 结构 似乎 比 乔 姆 斯 基 提 出 的 结构 更 抽象 、 


























简洁 、 出 色 。 我 们 已 经 看 到 了 这 一 结构 ， 层 次 贝 叶 斯 方法 实际 上 能 够 迅速 胡 


























定 那 


CD 在 英语 中 ,“ 吸 ”和 “转圈 ”对 应 的 单词 分 别 是 “peck” 和 “turn”， 恰 好 字母 数量 是 一 样 的 。 
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反 过 来 说 ， 经 验 数据 在 通过 贝 叶 斯 公式 对 实用 模型 进行 的 选择 中 扮演 了 关键 
的 角色 。 然 而 在 这 里 ， 这 种 对 数据 的 学 习 也 绝对 不 能 完全 归结 于 通过 强化 学 习 对 
相关 性 进行 的 简单 计算 。 这 一 学 习 针 对 的 是 极端 复杂 、 精 妙 的 模型 ， 它 会 在 不 同 
的 层次 上 进行 贝 叶 斯 计算 。 

这 真是 令 人 叹为观止 。 贝 叶 斯 公式 对 我 来 说 如 此 难以 理解 ， 甚 至 令 我 觉得 自 
己 没 有 足够 的 能 力 来 计算 概率 ， 但 我 的 大 脑 似乎 就 在 用 它 进行 计算 ， 而 这 同一 个 
大 脑 却 无 谓 地 期 望 着 成 为 有 自觉 、 有 能 力 的 贝 叶 斯 思考 者 ， 我 觉得 这 一 点 极其 迷 
人 ,但 又 令 人 困惑 。 似 乎 人 人 都 有 着 某 种 非常 精细 、 高 效 的 机 制 来 进行 复杂 的 由 
叶 斯 计算 ， 而 这 种 计算 高 度 并 行 ， 在 能 量 消耗 效率 上 也 无 可 比拟 。 然 而 奇怪 的 是 ， 
我 们 对 于 这 种 计算 毫 不 自觉 ， 而 且 完全 无 法 利用 这 种 能 力 来 正确 地 思考 。 































































































没有 事实 ， 只 有 诠释 。 
弗 里 德里 希 


.尼采 (1844—1900 ) 


构成 宇宙 的 是 故事 ， 而 非 原子 。 


Za + EEE (1913—1980 ) 


科学 用 看 不 见 的 简洁 代替 了 看 得 见 的 复杂 。 


让 


柏拉图 的 洞穴 


"佩兰 (1870—1942 ) 


s2 0z 


一 切 都 是 虚构 


假设 你 被 锁链 束缚 着 ， 只 能 看 见 洞穴 里 的 岩 壁 。 你 时 不 时 会 看 到 岩 壁 上 有 影 


子 出 现 并 移动 。 但 无 法 


回头 的 你 不 能 直接 看 到 这 些 影 子 出 现 的 原因 是 什么 。 对 于 








周遭 世界 ， 你 所 知道 的 一 切 就 是 感知 到 的 岩 壁 上 的 影子 ， 你 的 现实 因此 也 局 限 在 
这 些 影子 之 中 。 你 将 这 些 影子 当成 了 现实 。 

我 刚才 描述 的 ， 正 是 古 希 腊 时 期 哲学 家 柏拉图 提出 的 洞穴 寓言 。 对 柏拉图 来 
说 ， 这 个 寓言 切实 地 上 暗喻 了 他 那个 时 期 的 人 的 无 知 。 柏 拉 图 甚至 更 进一步 ,想象 
你 某 位 同样 被 锁 起 来 的 同伴 获得 了 自由 。 我 们 叫 他 皮 埃 尔 - 西蒙 吧 。 他 转 过 头 ， 
但 阳光 对 他 来 说 如 此 刺眼 ， 他 宁愿 重新 坐 下 来 推敲 岩 壁 和 那些 影子 。 在 柏拉图 看 
来 ， 与 他 同时 代 的 人 不 仅 非 常 无 知 ， 而 且 甘 于 这 种 无 知 。 

但 柏拉图 仍然 继续 想象 ， 现 在 皮 埃 尔 -西蒙 被 带 出 了 洞穴 ， 也 许 他 是 被 强行 
搜 出 来 的 。 皮 埃 尔 -西蒙 首先 会 觉得 惊 悉 不安、 不 知 所 措 , 但 他 逐渐 发 现 了 一 个 
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远 比 岩 壁 和 影子 更 真实 的 世界 ， 并 从 中 得 到 了 乐趣 。 激 动 万 分 的 他 最 后 回 到 了 洞 
羡 ， 向 你 讲述 了 他 不 可 胜 数 的 发 现 。 问 题 在 于 ， 现 在 你 会 把 他 当成 一 个 疯子 ! 你 
不 相信 他 ,全盘 否定 了 他 对 你 说 的 一 切 。 对 柏拉图 来 说 ， 这 就 描绘 了 与 他 同时 代 
的 人 的 最 大 弱点 : 他 们 更 愿意 活 在 错误 的 现实 之 中 ， 不 会 对 此 提出 质疑 。 
电影 《黑客 帝国 》 中 的 一 段 经 典 情 节 重 现 了 柏拉图 的 洞穴 寓言 。 在 主角 尼 奥 
开始 怀疑 日 常生 活 的 真实 性 时 ， 莫 菲 斯 向 他 提出 了 一 个 著名 的 两 难 问 题 ， 也 就 是 
在 红色 药丸 和 蓝 色 药 丸 之 间 如 何 选择 。 如 果 吃 下 蓝 色 药 丸 ， 尼 奥 就 会 带 着 无 知 醒 
来 ， 享 受 日 常生 活 ， 却 无 法 发 觉 这 种 日 常生 活 不 过 是 投射 在 洞穴 深 处 的 影子 ;如 
果 吃 下 红色 药丸 ， 他 就 会 逃脱 这 种 日 常 ， 发 现世 界 的 真实 。 对 于 电影 叙事 来 说 足 
以 庆幸 的 是 ， 尼 奥 选 择 了 红色 药丸 口 。 

红色 药丸 让 尼 奥 逃 出 困 住 他 的 计算 机 模拟 世界 一 一 那个 有 名 的 “母体 ” 
( Matrix )。 尼 奥 在 完全 不 一 样 的 世界 中 醒 来 ， 那 是 一 个 被 机 器 统治 、 有 如 末日 的 
危险 世界 。 之 后 英 菲 斯 带 着 尼 奥 进入 了 男 一 个 计算 机 模拟 世界 。 尼 奥 不 知 所 措 ， 
质疑 道 :“ 这 不 是 现实 。” 莫 菲 斯 的 回答 是 另 一 个 问题 : “现实 是 什么 ?怎么 定义 现 
实 ?” 然 后 莫非 斯 提出 了 一 个 可 能 的 答案 :“ 如 果 你 说 的 是 我 们 能 够 触摸 、 嗅 闻 、 品 
尝 和 看 见 的 东西 的 话 ， 那 么 现实 就 只 是 经 过 大 脑 诠释 的 电信 号 。” 































































































反 实 在 主义 


柏拉图 的 洞穴 寓言 以 及 《黑客 帝国 》 中 的 模拟 都 是 发 人 深 省 的 例子 ， 因 为 它 
门 质疑 了 现实 的 本 质 。 但 对 于 纯粹 贝 叶 斯 主义 者 来 说 ， 它 们 阐述 得 还 不 够 彻底 。 
这 两 个 例子 仍然 承认 一 个 前 提 : 人 们 自愿 被 办 禁 其 中 的 世界 的 外 面 就 是 现实 世界 。 
因此 它们 仍然 默认 现实 的 确 存在 。 在 这 些 例 子 之 中 ， 现 实 并 不 符合 这 些 世 界 中 的 
居民 的 信念 ， 这 一 点 令 人 不 安 且 令 人 好 奇 。 
这 种 说 法 在 许多 科学 家 谈论 科学 的 时 候 屡见不鲜 。 在 许多 地 方 都 能 零 零 星星 
地 看 到 这 样 的 说 法 : 科学 揭示 了 不 可 见 的 真理 或 者 隐藏 起 来 的 真实 世界 。 有 人 甚 
至 说 ， 科 学 就 是 到 达 真 理 的 唯一 方法 ， 也 是 幻象 的 终点 。 人 们 可 能 认为 水 是 无 限 
可 分 的 ,但 现实 是 ， 水 不 过 是 一 组 数目 有 限 、 互 相 穿 行 的 分 子 ; 人 们 可 能 认为 时 
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间 和 空间 都 是 绝对 的 ， 但 现实 是 ， 它 们 都 是 相对 于 观察 者 在 时 空中 的 轨迹 而 言 的 ; 
人 们 可 能 认为 人 体 之 中 只 有 属于 我 们 的 细胞 ， 但 现实 是 ， 大 部 分 组 成 人 体 的 活 细 
胞 其 实 是 各 种 各 样 的 细菌 ， 我 们 的 健康 和 心境 都 有 赖 于 它们 。 

在 本 章 中 ， 如 果 我 的 论证 没有 问题 的 话 ， 我 要 讨论 的 是 贝 叶 斯 主义 的 一 个 违 
反 直 觉 却 又 不 可 避免 的 结论 。 我 会 将 结论 留 到 最 后 ， 因 为 即使 你 认真 理解 了 本 书 中 
的 思想 链条 ， 大 概 也 会 倾向 于 否定 这 个 结论 。 某 些 虚构 的 说 法 对 纯粹 贝 叶 斯 主义 
者 来 说 更 可 信 ， 而 另 一 些 虚 构 说 法 对 实用 贝 叶 斯 主义 者 来 说 更 有 用 。 然 而 对 于 所 
有 合格 的 贝 叶 斯 主义 考 来 说 ， 一 切 事 物 都 只 能 是 某 种 虚构 ， 或 者 更 准确 地 说 ， 所 
有 事物 都 只 是 无 限 个 随机 算法 的 模拟 ， 而 我 们 其 实 就 是 在 这 些 随 机 算法 上 下 赌注 。 

因此 ， 我 认为 合格 的 贝 叶 斯 主义 者 必然 会 否定 这 样 的 假设 : 必然 存在 某 种 与 
人 们 的 想象 相符 的 现实 ， 一 个 超越 了 柏拉图 洞穴 的 宇 害 , 或 者 说 “母体 ”以 外 的 
物质 世界 。 我 其 至 进一步 认为 ， 电 子 真实 存在 的 假设 既 无 必要 也 不 实用 ， 其 至 对 
于 物理 学 确实 牵涉 客观 现实 的 假设 来 说 也 是 如 此 。 当 然 ， 这 些 模型 有 着 难以 置信 
的 用 处 和 预测 能 力 ， 值 得 我 们 向 其 赋予 大 部 分 的 置信 度 。 但 正如 博克 斯 的 名 言 所 
说 ， 我 认为 更 有 用 的 是 要 牢记 这 些 东西 都 只 是 模型 ， 而 “所 有 模型 都 是 错 的 "。 作 
为 合格 的 贝 叶 斯 主义 者 ,我 尤其 要 为 这 种 虚构 主义 立场 的 用 处 辩护 。 


























































































































































































































生命 是 否 存在 ? 





有 关 现 实 主义 的 辩论 经 常会 转向 那些 存在 主义 的 问题 ， 比 如 意识 是 否 存 在 外。 
这 个 主题 争议 太 大 ， 不 适合 直接 讨论 。 所 以 我 请 你 从 下 面 这 个 看 起 来 更 简单 的 问 
题 着 手 : 生命 是 否 存 在 ? 

生命 是 科学 中 最 困难 的 概念 之 一 一 一 仔细 思考 一 下 ， 科 学 中 毫 无 问题 的 概念 
实在 少 有 。 某 些 生 物 学 家 不 悦 于 承认 ， 生 命 就 是 一 个 没有 正规 定义 的 术语 。 男 一 
些 生物 学 家 建议 列 出 某 些 标准 ， 并 且 将 生命 定义 为 符合 那些 标准 的 自然 现象 组 成 
的 集合 。 人 们 常常 援引 的 准则 牵涉 了 复制 和 变异 的 概念 ， 而 达尔 文 的 演化 理论 依 
靠 的 正 是 这 些 概念 。 问 题 在 于 ， 这 样 的 定义 通常 并 不 符合 我 们 大 多 数 人 认为 的 生 
其 是 因为 ， 这 样 的 话 ， 计 算 机 病毒 也 可 以 被 看 作 生命 。 因 此 ， 某 些 生物 
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学 家 选择 将 生命 限制 在 生物 中 常见 的 分 子 范 围 之 内 ， 比 如 脱氧 核糖 核酸 (DNA ) 
和 核糖 核酸 (RNA ) 但 这 样 一 来 ， 人 们 可 能 会 有 疑问 ， 比 如 说 ,在 DNA 链 上 储 
存 的 信息 到 底 算 不 算 生命 。 
男 一 种 方法 就 是 将 生命 等 同 于 生物 中 典型 的 物理 化 学 性 质 。 这 就 是 卡尔 . 3B 
里 斯 顿 选择 的 方法 ， 它 依赖 于 马尔 可 夫 覆 盖 ( Markov blanket) 的 概念 。 这 一 覆盖 
就 是 将 外 部 环境 与 内 部 结构 分 隔 开 来 的 稳定 物质 结构 ,细菌 的 细胞 膜 就 是 一 个 典 
型 例子 。 和 覆盖 的 内 部 会 在 环境 中 汲取 某 种 形式 的 能 量 ， 也 就 是 所 请 的 自由 能 ， 
以 长 久保 持 自身 结构 ”。 个 自由 能 的 基本 性 质 就 是 ， 它 只 会 出 现在 远离 任何 热力 学 
平衡 的 地 方 。 恰 当地 使 用 自由 能 并 保持 内 部 结构 的 关键 在 于 ， 内 部 结构 需要 预期 
来 自 外 部 的 扰动 ， 并 且 确 定 能 否 在 其 中 得 到 可 资 利 用 的 自由 能 。 这 就 让 内 部 结构 
必须 发 展 出 一 套 关 于 外 部 现实 的 理论 。 但 至 关 重要 的 是 ， 为 了 做 到 这 一 点 ， 内 部 
能 掌握 的 数据 就 只 有 在 马尔 可 夫 和 覆盖 上 出 现 的 信息 。 
弗 里 斯 顿 在 2013 年 提出 ,许多 自然 过 程 运 转 的 作用 就 是 让 内 部 结构 能 够 计算 
贝 叶 斯 公式 的 某 种 近似 ， 也 就 是 我 们 在 第 14 章 提 到 过 的 所 谓 “ 变 分 贝 叶 斯 方法 ”。 
弗 里 斯 顿 甚至 认为 这 就 是 生命 的 本 质 : 生命 是 被 稳定 薄膜 与 外 界 分 隔 开 来 的 有 限 
环境 中 的 结构 。 或 者 用 热力 学 的 术语 来 说 :生命 就 是 在 粹 值 极 大 的 海洋 中 被 马尔 
"AUS s 2) HS T 2e BUS CECI RE o 
然而 ， 尽 管 这 种 定义 很 有 用 ， 但 与 其 他 依赖 于 生物 的 特性 或 者 相关 分 子 的 定 
义 一 样 ， 我 们 可 以 打赌 ， 弗 里 斯 顿 的 定义 也 会 包含 一 些 在 我 们 的 直觉 中 不 属于 生 
物 的 东西 ， 反 之 亦 然 。 在 看 到 定义 生命 遇 到 的 困难 之 后 ， 人 们 也 许 会 问 : 生命 是 
否 存在 ”生命 这 一 概念 真 的 具有 现实 性 吗 ?“ 物 质 世 界 可 以 分 为 生物 和 非 生物 的 部 
分 ”这 一 断言 之 中 是 否 包含 了 真理 ? 我 们 在 这 里 谈论 的 是 不 是 某 种 现实 的 事物 ? 
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货币 是 否 存在 ? 


目前 看 来 ， 对 生命 的 定义 还 不 涉及 国家 安全 问题 ， 尽 管 有 关 自 愿 终止 妊娠 、 




















O REX- 英格兰 等 科学 家 也 对 自由 能 进行 了 研究 。 
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动物 福利 或 者 机 器 人 权益 的 辩论 会 牵涉 生物 本 质 的 问题 。 然 而 货币 的 情况 却 并 非 
如 此 。 特 别 是 在 2008 年 ,“ 比 特 币 ” 出 现 了 ,并 且 价 格 不 断 攀 升 。 截 至 2018 年 ， 
“比特 币 ” 的 总 量 相当 于 “ 数 十 亿美 元 ”一 一 一 篇 匿名 论文 提出 的 理论 用 了 不 到 十 
年 就 发 展 到 了 这 一 步 。 但 这 种 没有 实体 媒介 的 “虚拟 货币 ”是 怎么 获得 某 种 价值 
的 呢 ? 如 果实 体 媒介 不 存在 的 话 ， 我 们 能 不 能 说 这 种 “货币 ”真实 存在 ? 

奇怪 的 是 ,我们 也 可 以 针对 所 有 人 都 承认 存在 的 传统 货币 问 出 同样 的 问题 。 
里 然 在 目前 人 们 认为 自己 拥有 并 用 于 互相 交换 的 货币 中 ， 有 90% 是 “电子 货币 ”， 
但 我 们 也 可 以 质疑 实体 货币 的 真实 性 ， 毕 竞 目前 大 部 分 流通 中 的 实体 货币 的 形式 
只 是 一 张 小 纸 片 。 为 什么 这 张 纸 片 拥有 某 种 价值 ? 是 什么 使 得 这 些 纸 片 成 了 真正 
的 纸币 ?如 果 这 种 纸币 的 假 钞 到 处 流通 ,但 没有 人 知道 怎么 分 辨 “ 真 钞 ” 的 话 ， 
那么 那些 假 钞 还 会 是 假 的 吗 外 ?总 而 言 之 ,货币 是 什么 ? 

DDC CAR + UE + 哈 拉 里 所 说 ， 货 币 就 像 被 神化 之 后 的 生命 和 历史 传说 那样 ， 
属于 虚构 叙事 之 一 ， 这 些 虚 构 叙 事 是 人 类 最 伟大 的 发 明 外 。 相 比 之 下 ， 黑 猩猩 相 
信 的 虚构 叙事 寥寥 无 儿 。 哈 拉 里 认为 ， 除 了 知人 之 外 的 物种 缺少 叙述 和 相信 这 种 
虚构 叙事 的 能 力 ， 正 因 如 此 ， 它 们 无 法 组 织 起 数 百 个 个 体 组 成 的 群体 。 而 知人 正 
好 相反 ， 他 们 懂得 如 何 协 调整 个 部 落 ， 甚 至 整个 文明 ， 人 口 不 断 迅 速 增长 ， 时 至 
今日 已 经 增长 至 数 十 亿 。 

人 类 社会 的 伟大 创新 之 一 就 是 物 物 交换 。 这 让 双方 在 进行 商业 交换 之 后 各 自 
都 有 所 得 益 。 但 物 物 交换 有 其 局 限 性 。 问 题 在 于 ， 大 量 任务 需要 投资 ， 而 且 只 
从 长 远 来 说 才能 获 利 。 债 务 这 一 市 场 经 济 的 黄 基 石 就 此 登场 。 换 句 话 说， 投资 者 
可 以 帮助 创业 者 着 手 某 个 项 目 ， 而 这 时 创业 者 就 对 投资 者 有 所 亏欠 。 投 资 者 通过 
这 种 方法 贷 出 了 一 项 债务 ， 而 创业 者 必须 偿还 这 项 债务 。 创 业者 欠 下 的 债务 数量 
就 是 我 们 现在 所 说 的 货币 。 

债务 可 能 是 人 类 历史 上 最 伟大 的 创新 。 它 催生 了 市 场 经 济 及 日 后 的 社会 分 工 ， 
也 带 来 了 令 人 目眩 的 结果 。 正 如 亚当 斯 密 观 察 到 的 那样 ， 一 件 简单 的 毛衣 的 制 
造 和 商业 化 ， 只 有 经 过 极其 大 量 的 自 利 个 体 之 间 复 杂 而 惊人 的 互动 后 才 得 以 完成 。 

思考 一 下 。 你 要 得 到 这 件 毛衣 ， 必 须 经 过 牧羊 人 、 娄 色 工 人 、 纺 纱 工 人 、 织 
布 工 人 的 手 ， 此 外 还 需要 一 个 复杂 的 分 配 系 统 ， 其 中 包括 批发 商 、 投 资 者 、 领 航 
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、 司 机 、 仓 储 管理 员 、 邮 政 人 员 、 售 货 员 ， 除 此 之 外 还 有 船舶 建造 人 员 、 工 程 
师 、 技 术 员 、 生 产 负责 人 ， 也 不 要 忘记 工人 制造 毛衣 时 所 需 工 具 的 制造 者 。 哪 怕 
是 制造 剪刀 这 种 最 简单 不 过 的 工具 ， 也 需要 矿工 、 铁 折 、 提 供 炼 铁 所 需 木 材 的 伐 
木工 人 、 制 砖 工人 和 泥 瓦 工 。 这 里 还 没 算 上 过 去 几 个 世纪 的 工人 ， 如 果 没 有 他 们 ， 
今天 工人 所 拥有 的 专业 技术 的 基础 就 会 不 复 存 在 。 

简 而 言 之 ， 我 们 必须 看 到 ， 生 产 和 销售 任何 毛衣 所 需 的 技能 和 工作 的 列表 真 
是 永 无 止境 ! 此 外 ， 与 之 同样 令 人 惊叹 的 是 ， 这 一 神奇 的 系统 运转 良好 ， 但 其 中 
任何 个 体 都 无 法 独自 生产 出 一 件 毛 衣 。 如 果 世 界 上 只 剩 下 一 个 人 的 话 ， 他 不 知道 
怎么 独自 制作 这 样 一 件 毛衣 ， 除 非 他 肯 花 上 数 十 年 的 时 间 一 一 而 这 样 做 的 人 怎 
养活 自己 是 个 大 问题 ! 带 博 ' 吉 罗 在 他 的 视频 频道 Monsieur Phi 中 这 样 总 结 道 : 
“我 们 生活 在 难以 置信 、 无 法 理解 的 物品 之 中 ， 任 何人， 就 是 字面 意义 上 的 任何 
人 ， 都 不 知道 怎么 独自 制作 这 些 物品 四 。” 举 债 成 了 经 济 和 技术 进步 的 引擎 。 为 了 
债务 能 顺利 运作 ， 社 会 需要 一 个 系统 ， 用 以 保证 在 任何 时 刻 、 任 何 情况 下 ， 任 何 
两 个 个 体 都 能 记 住 双方 互相 从 下 的 债务 并 达成 一 致 。 这 个 系统 就 是 货币 系统 。 贷 
币 的 每 一 次 流通 可 以 就 此 被 视 作 两 个 个 体 之 间 债 务 的 偿还 或 者 贷 出 。 我 给 你 一 份 
糕点 ， 所 以 你 对 我 欠 下 了 债务 ， 而 你 通过 给 予 我 货币 的 方式 偿还 了 这 项 债务 。 等 
价 的 说 法 也 可 以 是 : 你 给 予 了 我 一 些 货币 ， 由 此 贷 出 了 一 项 债务 ， 而 我 向 你 提供 
一 份 糕点 来 偿还 这 项 债务 。 

金钱 的 精妙 之 处 就 在 于 ， 这 些 债 务 可 以 转移 给 别人 。 如 果 爱 丽 丝 欠 我 的 钱 ， 
那么 鲍 勃 可 以 通过 给 予 我 相应 金钱 的 方式 撤销 爱丽 丝 的 这 项 债务 。 银 行 发 行 的 纸 
币 和 电子 银行 系统 都 属于 同一 种 技术 ， 目 的 就 是 在 任何 时 刻 确定 全 世界 债务 的 状 
态 。 同 样 ， 这 些 技术 尤其 能 让 我 们 不 至 于 忘记 还 剩 下 多 少 债务 需要 偿还 。 这 是 不 
是 说 明了 债务 的 确 存在 ”如 果 我 从 下 了 朋友 的 债 ， 但 这 位 朋友 和 我 都 忘记 了 这 项 
债务 的 存在 ， 那 会 发 生 什么 事情 ? 如果 关于 这 项 债务 的 信息 永久 地 丢失 了 又 会 怎 
么 样 ? 未 来 一 直 处 于 未 偿还 状态 的 债务 ， 还 算 不 算 现 实 ? 这 个 社会 的 基石 之 一 为 
何 与 具体 事物 似乎 相去 甚 远 ? 

贝 叶 斯 主义 者 的 回答 非常 清晰 : 一 切 都 是 虚构 。 与 货币 和 生命 一 样 ， 债 务 是 
一 个 故事 。 然 而 ， 它 的 力量 源 录 正在 于 ， 这 个 故事 赢得 了 我 们 当中 绝 大 部 分 人 的 


yz 









































» 








































































































320 | 


信任 ， 而 它 也 让 我 们 能 够 开展 建设 并 共同 生活 。 债 务 的 存在 是 一 
但 它 很 有 用 ， 它 不 仅 对 于 整个 社会 来 说 很 有 用 ， 而 
认为 一 张 10 欧元 的 纸币 确实 
们 将 它 放 在 口袋 里 ， 而 不 是 把 它 扔 进 垃圾 桶 。 然 后 ， 
我 们 就 此 获 益 于 对 这 张 纸 币 的 内 在 价值 的 而 
的 不 是 货币 本 身 的 实际 存在 ， 
是 个 有 用 的 虚构 叙事 ， 
根据 哈 拉 里 的 说 法 ,那些 让 自 利 的 个 体能 够 合作 为 群 
类 最 为 伟大 的 创新 。 我 们 每 个 人 都 被 这 些 传说 所 哄骗 。 
1948 年 的 《世界 人 权 宣 
在 尊严 和 权利 上 一 律 平等 "。 在 美国 独立 宣言 的 序言 中 ， 托 马 
这 些 真理 是 不 言 而 喻 的 : 人 人 生 而 平等 ， 造 物 者 赋予 他 们 若干 
包括 生命 权 、 自 由 权 和 追求 幸福 的 权利 。 
只 要 细 细 思考 ， 
命 一 样 ， 实 际 上 都 远 非 明 显 正 确 或 者 现实 。 即 使 是 自我 同一 性 中 
某 些 哲学 家 所 质疑 。 我 们 在 第 
“人 不 外 平一 束 或 一 
吉 罗 得 出 了 这 档 
为 了 阐明 这 种 虚构 主义 的 立场 ,我们 现在 来 讨论 一 
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且 对 于 我 们 每 个 人 来 说 也 很 有 
j 有 相应 的 价值 是 个 有 用 的 想法 ， 因 为 这 会 让 我 
我 们 可 以 用 这 张 纸 币 交 换 一 














信 ， 
而 是 相信 其 存在 带 来 的 好 处 。 
E 一 有 用 的 虚构 叙事 。 
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这 个 概念 也 被 
- ilti 


“我 ”是 一 个 虚构 叙事 ， 但 这 个 虚构 叙事 很 有 用 加。 


下 自由 。 


目的 论 ， 科 学 中 的 一 条 和 死路? 


从 直觉 上 来 说 ， 
意志 。 然 而 ， 在 一 个 而 


反应 和 随机 二 
理论 来 说 ， 它 的 方程 里 并 没有 “ 自 





























定性 的 世界 中 ， 


自由 依赖 的 先决 条 件 就 是 存在 某 种 允许 我 们 进行 选择 的 自 
我 们 的 选择 是 由 大 脑 内 部 的 电化 学 反应 预 
先 确 定 的 。 即 使 在 遵循 哥本哈根 诠释 的 量子 世界 之 中 ， 我 们 的 选择 
有 件 的 结果 。 对 于 量子 场 论 这 个 我 们 目前 为 止 所 掌握 的 最 优秀 的 物理 
由 意志 ”这 个 概念 的 一 席 之 地 。 























的 概念 ， 相 当 于 抛弃 了 现代 物理 学 。 




















也 只 是 电化 学 














接受 自 














由 意志 
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自由 意志 可 被 看 作 目 的 论 的 特殊 情况 。 目 的 论 就 是 以 现象 的 结果 来 解释 现象 
本 身 的 一 系列 理论 。 特 别 是 亚 里 士 多 德 ， 他 曾 为 目的 论辩 护 :“ 因 为 看 不 见 移动 者 
推敲 自身 的 行动 ， 而 认为 (自然 的 ) 事物 即使 没有 目的 也 能 产生 ， 这 实在 非常 荒 
PES" 目的 论 最 夸张 的 版 本 尝试 通过 宇宙 的 最 终 目 的 来 解释 宇宙 本 号 ， 举 个 例子 ， 
这 个 目的 可 以 是 智慧 生命 的 出 现 。 这 就 是 某 些 人 所 说 的 强人 择 原理 。 提 但 这 一 立 
场 的 通常 是 一 些 有 神 论 者 ， 他 们 在 其 中 看 到 了 某 种 形式 的 智能 设计 。 

令 人 惊异 的 是 ， 人 们 在 量子 场 论 的 核心 中 也 能 看 到 目的 论 的 存在 ， 它 在 那里 
的 名 字 比 较 温 和 ， 叫 最 小 作用 量 原 理 。 它 首先 由 费 马 在 光线 的 研究 中 发 现 ， 然 后 
被 莫 佩 尔 带 推广 到 物质 上 ， 接 下 来 被 希 尔 伯 特 用 到 了 广义 相对 论 中 ， 之 后 被 费 曼 
延伸 到 了 量子 力学 之 中 。 最 小 作用 量 原理 大 体 上 相当 于 断言 自然 一 直 在 尝试 最 小 
化 某 个 被 称 为 作用 量 的 数量 四。 在 量子 场 论 这 一 特殊 情况 之 中 ， 这 个 目的 论 的 原 
理 甚至 每 天 都 被 理论 物理 学 家 采用 ! 

我 们 甚至 也 能 在 其 他 物理 原理 的 背后 看 到 目的 论 的 身影 ， 包 括 提出 自然 会 趋 
向 于 热力 学 平衡 的 热力 学 第 二 定律 、 原 子 中 的 电子 会 首先 尝试 占据 能 量 最 低 的 轨 
道 这 一 事实 ,以 及 肥皂 泡 的 表面 会 使 表面 能 最 小 化 的 现象 。 

甚至 有 一 整个 知识 领域 几乎 只 基于 单个 目的 论 原则 ， 那 就 是 博弈 论 。 博 弈 论 
是 由 约翰 '， 3 e 诺 伊 受 和 约翰 纳什 等 数学 家 引入 的 ， 它 假设 所 有 个 体 都 会 做 出 
战略 性 的 行为 ， 采 取 能 够 最 大 化 将 来 效用 的 行为 。 尤 其 是 在 国际 象棋 这 种 序 贯 博 
弈 之 中 ， 博 弈 论 假设 玩家 会 采取 动态 规划 的 原则 ， 这 个 算法 原则 的 思想 在 于 从 结 
果 出 发 ， 比 如 ,说 得 这 盘 国 际 象棋 或 者 进入 某 个 优势 局 面 ， 然 后 在 时 间 上 回溯 
确定 要 达到 目的 的 话 需 要 下 出 哪 一 步 。 

这 就 是 地 缘 政 治学 人 研究 者 布鲁斯 : 布 埃 诺 : 德 梅 斯 基 塔 所 请 的 逆向 因果 。 并 
不 是 圣诞 集 市 产生 了 圣诞 节 ， 而 是 圣诞 节 产 生 了 圣诞 集 市。 据 德 梅 斯 基 塔 所 说 ， 
这 种 推理 在 理解 社会 科学 时 必 不 可 少 。 比 如 ， 对 于 博弈 论 研究 者 来 说 ， 法 律 与 司 
法 的 作用 并 不 是 惩罚 那些 不 道德 的 行为 ， 而 是 阻止 社会 成 员 以 不 道德 的 方式 行动 。 
我 们 并 不 是 因为 发 生 犯 罪 而 惩罚 ， 惩 罚 的 目的 是 不 再 发 生 犯 罪 "0。 

然而 ， 尽 管 目的 论 在 物理 学 中 用 处 很 大 ， 甚 至 在 社会 科学 中 扮演 了 不 可 或 缺 
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的 角色 ， 但 也 有 人 说 “: 目的 论 论证 被 现代 科学 方法 论 所 和 否定， 因为 因果 关系 原则 
蕴含 了 原因 与 结果 之 间 的 一 项 关系 ， 其 中 结果 不 能 先 于 原因 出 现 。” 的 确 ， 这 样 的 
因果 关系 原则 与 目的 论 并 不 相 容 。 同 时 接受 二 者 似乎 会 自 相 矛盾 。 


























但 与 某 些 科 学 家 的 断言 正好 相反 ， 大 量 科学 理论 并 没有 因果 的 概念 。 即 使 是 
那些 存在 因果 概念 的 理论 ， 比 如 博弈 论 ， 结 果 也 可 以 在 时 间 上 先 于 原因 。 此 外 ， 
即使 是 演化 生物 学 家 ， 人 们 可 能 认为 他 们 处 于 反目 的 论 斗 争 的 前 线 ， 但 他 们 也 经 
常 谈 及 他 们 研究 的 物种 之 中 某 些 基因 的 意图 或 者 策略 ， 理 查 德 ， 道 金 斯 的 名 著 
《自私 的 基因 》( The Selfish Gene ) 的 书 名 就 是 范例 。 

其 实 ， 我 们 已 经 界定 了 所 有 因果 模型 的 特征 : 它们 都 是 贝 叶 斯 网 络 。 与 之 相 
BR, 大 量 科 学 模型 并 没有 因果 概念 ， 例 如 马尔 可 夫 随 机 场 。 尤 其 是 在 广义 相对 论 
中 ， 时 空 是 一 个 整体 ， 而 物理 学 只 不 过 描述 了 时 空中 各 种 事件 之 间 的 相关 性 。 我 
们 在 其 中 找 不 到 因果 关系 原则 ， 或 者 至 少 可 以 说 ， 它 并 不 是 一 个 基础 性 的 概念 。 
整个 时 空 作 为 整体 存在 ， 而 不 是 一 秒 接着 下 一 秒 的 。 实 际 上 ， 甚 至 “宇宙 随 着 时 
间 的 某 种 脚步 演化 ”这 个 概念 也 已 经 被 广义 相对 论 否 定 ， 对 它 来 说 ， 时 间 的 流逝 
只 是 一 个 与 穿越 时 空 的 路 径 相关 的 函数 。 

宇宙 符合 因果 关系 吗 ?” 是 否 应 该 反 过 来 放弃 因果 关系 的 原则 ?其 实 有 两 种 不 
同 的 方式 可 以 调和 因果 关系 原则 与 目的 论 。 要 理解 第 一 种 调和 方式 ， 先 重新 思考 
一 下 最 小 作用 量 原理 可 能 是 个 好 主意 。 变 分 分 析 ， 尤 其 是 欧 拉 一 拉 格 朗 日 方程 ， 
证 明了 在 某 些 假设 之 下 ， 这 种 目的 论 的 原则 实际 上 在 数学 上 等 价 于 描述 因果 关系 
的 微分 方程 由。 同样 ， 在 某 些 假设 之 下 ， 动 态 规划 那 种 目的 论 式 的 方程 也 等 价 于 
带 有 因果 概念 的 哈密 尔 顿 - 雅 可 比 - 贝 尔 曼 方程 3。 

目的 论 的 方法 常常 等 价 于 因果 论 的 方法 器 。 面 对 这 一 事实 ， 因 果 关 系 的 辩护 
者 立即 要 求 将 所 有 目的 论 的 方法 换 成 带 有 因果 关系 的 等 价 方法 。 毕 竞 很 多 基础 物 
理 理论 一 般 都 能 写成 ?= f(y) 的 形式 。 换 个 说 法 ,“ 近 未 来 ”就 是 关于 当前 状态 的 
函数 ( 其 中 可 能 存在 随机 扰动 )。 

然而 在 许多 情况 下 ， 偏 向 目的 论 的 观点 似乎 明显 更 为 自然 。 我 们 很 难 想 象 国 


















































































































































(D ”这 一 引 语 来 自 法 语 版 维基 百科 的 “T6léologie”( 目的 论 ) 页 面 (2018 年 )。 但 它 在 2018 年 3 
月 27 日 被 用 户 “AhBon?” 删 除 ， 理 由 是 它 “ 将 不 同类 型 的 原因 混为一谈 而 导致 误解 ”。 
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际 象棋 冠军 采取 某 种 策略 并 不 是 为 了 达成 终局 ， 也 很 难 想象 婴 儿 与 泣 不 是 为 了 吸 
引 我 们 的 注意 力 ， 同 样 难以 想象 科研 工作 者 思考 并 不 是 为 了 理解 周遭 的 世界 。 这 


些 目的 论 叙事 与 某 种 因果 关系 视点 的 等 价 关 系 远 非 显然 。 但 重要 的 是 ， 这 种 因果 














关系 的 视点 在 这 里 的 用 处 似乎 很 成 问题 。 
这 就 将 我 们 引 向 了 调和 目的 论 与 因果 关系 的 第 二 种 方法 。 回 忆 一 下 ， 所 有 贝 
叶 斯 式 的 预测 都 是 将 不 同 模型 的 预测 结合 起 来 得 到 的 。 也 就 是 说 ， 对 于 纯粹 贝 叶 
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斯 主义 者 来 说 ， 多 个 互 不 相 容 的 有 用 模型 不 仅 可 以 同时 存在 ， 其 至 还 是 件 好 事 ! 


目 容 的 模型 组 成 的 森林 比 其 中 每 一 棵 树 都 要 寡 智 。 所 以 我们 来 培育 整个 森 





此 外 ,我们 向 特定 模型 赋予 的 置信 和 度 也 取决 于 我 们 希望 回答 的 问题 。 对 于 认 
知 能 力 有 限制 的 实用 贝 叶 斯 主义 者 来 说 就 更 是 如 此 。 如 果 目 标 是 预测 国际 象棋 冠 
军 下 一 步 将 要 下 出 什么 棋 ， 那 么 量子 场 论 对 他 来 说 就 室 无 用 处 。 

然而 奇怪 的 是 ， 借 用 某 个 理论 中 的 想法 ,将 其 应 用 到 其 他 理论 之 中 ， 这 种 做 法 
通常 很 有 用 。 比 如 理 查 德 . 费 曼 就 借用 了 经 典 力学 中 的 最 小 作用 量 原理 ,将 其 应 
用 到 量子 力学 之 中 ， 获 得 了 惊人 的 成 功 。 因 此 ， 一 个 诱 人 的 想法 就 是 ， 众 多 可 靠 
理论 之 间 共 同 的 思想 ， 比 如 所 有 人 都 能 理解 的 某 些 概念 ， 可 能 自身 就 拥有 某 种 真 
实 性 一 一 至 少 是 在 相互 等 价 的 意义 上 。 人 类 之 间 交 流 的 关键 的 确 在 于 不 同 个 体 的 


K JRH 


看 到 的 红色 相互 等 价 。 这 就 可 能 暗示 了 某 些 对 象 拥有 独立 于 任何 模型 的 真实 性 "。 
然而 ， 这 里 却 遗 漏 了 货币 的 例子 。 在 两 个 不 同 的 预测 性 模型 之 中 ， 某 些 算 法 
程序 相互 等 价 ， 这 一 事实 并 不 能 在 任何 意义 上 保证 这 些 程序 在 任何 预测 性 模型 





























































































































P 存 在 相似 的 神经 元 激活 模式 ， 这 让 我 可 以 假设 ， 我 看 到 的 红色 基本 上 与 你 























都 会 出 现 ， 甚 至 不 能 保证 任何 可 靠 的 预测 性 模型 都 会 用 到 这 样 的 程序 。 货 币 并 不 


存在 于 量子 场 论 中 。 





















































科研 人 员 有 时 候 会 谈 到 理论 的 适用 范围 ， 或 者 在 某 些 情境 中 的 有 效 理论 。 用 





贝 叶 斯 主义 的 语言 来 说 ， 这 其 实 更 应 该 说 成 理论 的 可 信 范 围 。 实 用 贝 叶 斯 主义 者 























(D 此外， 这 也 让 我 们 能 够 定义 另 一 种 有 用 的 概念 ， 区 别 于 讨论 实用 贝 叶 斯 主义 者 时 引入 的 概念 。 
在 这 里 ， 如 果 某 个 非 预 测 性 的 理论 在 大 量 预测 性 理论 中 被 重复 使 用 ， 那么 它 也 可 以 是 有 用 的 。 


实 





























际 上 ， 和 牛顿 运动 定律 和 演化 理论 正 是 在 这 种 意义 上 有 用 。 
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更 进一步 ， 会 向 每 个 理论 赋予 特定 的 适用 范 目 
量 互 相 不 兼容 的 理论 适当 地 结合 而 成 ， 而 这 些 理论 应 该 各 自 志 














目 。 任 何 普 适 的 预测 性 模型 应 该 由 大 


























有 自身 的 适用 范围 ， 












































而 某 个 理论 的 适用 范围 可 以 与 男 一 个 理论 的 适用 范围 部 分 重 全 。 这 种 贝 叶 斯 主义 

















方法 虽然 缺乏 普遍 性 ， 却 不 会 导致 任何 问题 ， 


关于 现实 ， 图 灵 - 丘 奇 论题 有 何 


说 法 ? 





毕竟 “所 有 模型 都 是 错 的 ”。 


那些 更 偏向 于 纯粹 主义 的 人 可 能 会 因为 有 效 理 论 感到 失望 。 某 些 物理 学 家 仍 
然 坚 持 ( 偏好 于 ) 认为 他 们 的 目的 就 是 追寻 某 种 真理 。 























但 为 了 确定 宇宙 的 根本 规律 ， 或 者 说 ， 为 了 看 


























定 宇 宙 的 根本 而 完整 的 唯一 规 


律 ， 我 们 只 需 接 受 一 个 单独 的 假设 。 这 个 假设 就 是 〈 物理 学 的 ) FL - 丘 奇 论题 ， 












































容 就 是 宇宙 中 的 任何 东西 都 不 能 完成 





图 灵机 无 法 完成 的 计算 。 引 人 深思 的 是 ， 




















内 
接受 图 灵 一 丘 奇 论题 实际 上 等 价 于 断定 任何 通用 图 灵机 都 可 以 模拟 整个 宇宙 ， 而 
定 这 一 论题 只 会 让 寻求 真理 这 个 任务 变 得 更 复杂 。 因 此 ， 所 有 所 谓 的 “图 灵 完 


全 ”的 机 器 之 中 都 包含 了 宇宙 的 所 有 规律 UU 


接 下 来 需要 确定 的 就 上 只 剩 下 机 顺 中 的 数据 ， 正 是 这 些 数 


与 整个 宇宙 完全 一 致 。 然 而 ， 确 定 这 人 台 


务 ! 我 们 可 以 想象 那些 描述 整个 宇宙 的 数据 能 够 被 大 大 压缩 ， 

















虽 让 这 人 台 机 器 的 行为 


机 器 中 的 数据 显然 是 一 个 不 切实 际 的 任 








但 即使 如 此 ， 我 们 





也 敢 打 赌 ， 这 些 数 据 压 缩 后 的 大 小 会 远 远 超 出 10 字 节 。 和 宇宙 中 没有 任何 计算 机 





能 够 储存 整个 宇宙 的 模拟 算法 的 源 代 码 ! 





更 不 切实 际 的 是 ， 这 种 任务 也 没有 任何 意义 。 这 是 因为 ， 单 单 读 取 这 些 数据 
所 需 的 计算 时 间 就 可 以 跟 宇 宙 的 年 龄 比肩 。 然 而 ， 正 如 分 析 某 段 代码 那样 ， 要 分 
析 这 个 宇 害 ， 我 们 同样 必须 研究 其 执行 过 程 。 假 设 宇宙 拥有 庞大 的 逻辑 深度 ， 这 























项 任务 需要 花费 的 时 间 就 会 长 得 不 可 思议 ! 实际 上 ， 莱 斯 定 到 





但 我 们 先 暂 时 忘记 这 些 物理 上 的 限 


























甚至 证 明了 ， 对 代码 进行 系统 分 析 也 是 一 个 不 可 判定 的 问题 s 
证 。 纯 粹 贝 叶 斯 主义 者 会 有 什么 说 法 ?所 




















H ( Rice’s theorem ) 
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才能 使 机 器 的 模拟 与 这 个 宇宙 完全 符合 ? 
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对 于 第 二 个 问题 ， 回 答 是 否定 的 。 回 忆 一 下 ， 所 罗 门 诺 夫 妖 的 举动 非常 符合 
贝 叶 斯 主义 ， 它 从 来 不 会 将 所 有 鸡蛋 放 在 同一 个 篮子 里 。 在 分 析 了 10 字 节 的 数 
据 之 后 ， 即 使 它 的 置信 和 度 几 乎 全 被 放 在 唯一 一 个 宇宙 模型 之 上 ， 它 也 不 可 能 断定 
MAP 模型 就 是 这 个 宇宙 的 模型 。 实 际 上 ， 如 果 和 宇宙 想 欺 骗 所 罗 门 诺 夫 妖 ,那么 它 
总 有 办 法 做 到 ， 方 法 就 是 选择 一 段 代 码 ， 其 所 罗 门 诺 夫 复杂 度 必 须 大 于 提供 给 所 
罗 门 诺 夫 妖 的 信息 量 。 

这 样 的 话 ， 即 使 拥有 无 穷 无 尽 的 计算 能 力也 无 法 确认 任何 真理 。 这 种 情况 在 
实践 中 尤其 明显 。 因 此 ， 在 实际 应 用 中 ,包括 在 粒子 物理 学 这 个 领域 中 ， 只 有 和 那 
些 有 效 理论 才 算 重 要 。 我 们 手头 上 只 有 有 效 理 论 ， 而 这 些 有 效 理论 因此 必然 只 是 
某 种 虚构 。 这 就 得 出 了 本 章 的 惊人 结论 : 一 切 都 是 虚构 。 它 的 推论 就 是 ， 智慧 可 
以 简单 地 归结 为 确定 哪些 虚构 叙事 是 有 用 的 。 






















































































( 工具 主义 的 ) 非 实在 论 有 用 吗 ? 





























尽管 这 个 结论 是 贝 叶 斯 主义 的 推论 ， 但 如 果 你 觉得 它 并 非 有 用 ， 那 么 你 还 是 
可 以 舍弃 这 个 结论 。 我 认为 事实 恰好 相反 ， 在 我 看 来 ， 至 少 有 四 个 理由 说 明 虚 构 
主义 在 现实 中 有 它 的 用 处 。 

我 的 第 一 个 理由 就 是 虚构 主义 痔 明了 科学 的 好 处 。 大 量 关 于 科学 有 什么 用 处 
的 辩论 都 归结 于 质疑 科学 发 现 是 不 是 真理 。 不 幸 的 是 ， 某 些 对 科学 作为 真理 的 辩 
护 在 涉及 牛顿 运动 定律 或 者 社会 科学 时 会 滥用 一 些 不 可 靠 的 论证 。 比 如 说 ， 很 多 
尝试 在 科学 与 伪 科学 之 间 画 出 一 条 明确 的 界线 ， 仿 佛 那些 值得 我 们 给 予 所 有 置 
信和 度 的 模型 与 一 点 置信 度 都 不 应 该 得 到 的 模型 之 间 有 着 某 种 天 然 的 边界 。 这 种 边 
界 看 起 来 并 非 真实 ， 甚 至 对 真理 的 寻求 也 看 起 来 并 非 真 实 。 对 我 来 说 ， 贝 叶 斯 方 
法 使 这 场 辩 论 大 大 明晰 了 起 来 。“ 所 有 模型 都 是 错 的 "。 但 某 些 模型 比 其 他 模型 更 
可 靠 、 更 有 用 。 所 以 ,科学 的 意义 在 于 识别 出 那些 可 靠 的 模型 并 勾勒 出 它们 的 
用 范围 。 此 外 ， 科 学 界 的 同行 评议 判断 的 似乎 主要 是 科学 成 果 是 否 有 用 ， 而 不 
是 它们 是 不 是 真理 (或 者 说 它们 的 有 效 性 如 何 )。 

我 的 第 二 个 理由 就 是 虚构 主义 能 对 抗 自信 过 度 。 我 们 之 前 已 经 看 到 ， 这 种 自 
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是 最 常见 、 最 有 害 的 认 知 偏差 。 它 让 我 们 退缩 到 我 们 觉得 正确 的 事物 当中 ， 
而 不 会 去 怀疑 这 些 真 理 。 对 我 来 说 ， 这 似乎 是 在 学 习 各 种 违反 直觉 的 概念 、 现 象 
或 解释 时 最 主要 的 障碍 。 要 对 抗 这 种 自信 过 度 ， 我 觉得 很 有 用 的 一 个 方法 就 是 认 
为 手头 上 的 那些 理论 实际 上 是 某 种 “锤子 ”， 而 不 是 真理 。 它 们 也 许 很 有 用 ， 但 
也 可 能 被 更 好 的 工具 代替 。 在 我 看 来 ， 完 全 接受 这 种 哲学 取向 ， 也 就 意味 着 否定 
任何 理论 作为 真理 的 可 能 性 。 我 认为 ， 这 就 是 在 对 抗 自 信 过 度 时 必 不 可 少 的 一 
环 一 一 虽然 还 有 另 一 个 关键 之 处 ， 就 像 工具 盒 里 的 某 些 工 具 那 样 ， 某 些 理论 比 其 
他 理论 更 有 用 。 

我 的 第 三 个 理由 就 是 虚构 主义 能 让 我 们 对 词语 的 感情 色彩 不 至 于 过 度 敏 感 09。 
尤其 是 “现实 ”或 “正确 ”等 词语 ， 它 们 会 给 人 带 来 非常 正面 的 联想 ， 似 乎 可 以 
解释 为 什么 尼 奥 带 着 某 种 道德 责任 知 下 了 红色 药丸 。 这 种 做 法 带 来 的 问题 就 是 ， 
大 量 相信 伪 科学 理论 的 人 对 于 他 们 的 立场 的 正确 性 有 着 某 种 非 理 性 的 迷恋 。 那 些 
自称 “ 坐 拥 真理 ”的 科学 家 对 这 些 伪 科学 信徒 的 任何 质疑 ， 都 必然 会 被 认为 是 对 后 
者 的 个 人 攻击 ， 于 是 ， 这 就 可 能 会 让 其 中 较为 温和 的 人 变 成 无 法 无 天 的 狂 信者 1。 
质疑 某 个 我 们 珍视 的 理论 是 不 是 真理 可 能 非常 困难 。 即 使 对 置信 度 的 计算 也 许 不 
完全 符合 贝 叶 斯 公式 ， 对 我 来 说 ,质疑 模型 是 否 有 用 似乎 要 合理 得 多 。 

我 的 第 四 个 理由 就 是 学 习 的 连续 性 。 我 们 往往 倾向 于 想象 学 生 在 上 了 一 门 课 、 
读 了 一 本 教材 或 者 看 了 一 段 视频 之 后 ， 就 会 从 无 知 的 状态 转变 为 通晓 的 状态 。 然 
而 这 种 理想 情况 似乎 完全 不 切实 际 。 我 是 在 十 多 年 前 学 到 贝 叶 斯 公式 的 , 但 直到 
现在 ,我 还 在 逐步 加 深 对 它 的 理解 一 一 接 下 来 要 走 的 路 还 很 远 。 学 习 必然 是 渐进 
的 。 经 过 一 个 又 一 个 数据 点 、 一 个 又 一 个 论证 、 一 个 又 一 个 思想 实验 ,我 们 的 置信 
度 逐 渐变 化 ， 而 且 这 种 变化 一 般 也 会 有 所 反复 。 只 有 在 考察 大 量 数据 、 进 行 大 量 近 
似 的 贝 叶 斯 计算 以 及 随机 MCMC 计算 之 后 ， 我 们 的 置信 和 度 才 会 变 得 足够 可 靠 09。 
学 习 是 一 支 舞蹈 。 对 我 来 说 ， 最 好 是 让 探寻 有 用 理论 来 引领 这 支 舞蹈 ， 而 不 是 发 
现 真理 的 野心 。 

总 而 言 之 ， 虚 构 主 义 对 我 来 说 似乎 很 有 用 。 但 我 并 不 打算 用 这 种 工具 主义 的 论 
调 来 结束 我 对 虚构 主义 的 辩护 。 最 后 ， 我 想 讨论 两 个 模型 ， 它 们 至 少 值得 拥有 与 现 
实 主义 相同 的 置信 度 。 要 介绍 这 些 模 型 ， 我 们 必须 重新 谈 谈 卡尔 ， 弗 里 斯 顿 。 

































































































































































































































































大 脑 之 外 的 世界 是 否 存在 ? 
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我 们 拥有 出 众 的 能 力 ， 能 够 理解 猫 、 气 候 变 暖 甚至 宇宙 历史 的 存在 。 然 而 ， 我 




















们 的 大 脑 实际 上 只 依靠 各 种 感 
觉 、 触 觉 、 本 体感 觉 、 平 衡 感觉 














这 些 感觉 带 来 的 感受 毕 竞 离 猫 

















从 1983 年 开始 ， 深 度 学 习 的 莫 基 者 之 一 、 





里 . 欣 顿 就 与 合作 者 一 同 





行 预测 的 机 器 U9, 19088 年 ， 埃 德 温 . 杰 恩 斯 提 HH 


























言 接 受 的 信息 就 做 到 了 这 一 点 ， 包 括 视觉 、 听 觉 、 咱 
、 温 度 感 党 和 其 他 我 们 能 感知 到 的 各 种 感觉 。 然 而 ， 
和 和 气候 变 暖 的 本 质 非 常 遥远 ， 更 不 用 说 宇宙 历史 了 。 

心理 学 家 和 计算 机 科学 家 杰 弗 


指出 ， 大 脑 的 行为 就 像 一 台 依 靠 感官 得 到 的 观察 结果 进 














上 ， 大 脑 完 成 这 一 任务 的 方法 依赖 

















于 贝 叶 斯 公式 RI。 在 20 世纪 90 F4, RTE E 

















中 大 脑 与 外 部 世界 被 一 个 


部 世界 的 模型 ， 它 利用 的 正 是 由 弗 里 











推断 。 弗 里 斯 顿 、 欣 顿 和 











这 个 关于 人 类 思维 如 何 运 作 的 假说 最 惊人 的 地 方 ， 


Un AGE SATIS PC， 但 大 脑 仍然 能 够 重建 有 关 整 个 外 
斯 顿 在 2013 年 推广 到 生命 领域 的 变 分 贝 叶 斯 





























斯 顿 由 此 发 展 了 一 个 模型 ， 其 

















杰 恩 斯 的 假说 ， 就 是 我 们 的 大 脑 能 够 仅仅 从 感官 数据 出 
发 ,重建 整个 关于 外 部 世界 的 模型 。 








就 是 大 脑 构建 关于 外 部 世界 





的 模型 仅仅 是 为 了 解释 来 自 感官 的 感受 。 外 部 世界 实际 上 不 太 重 要 ， 重 要 的 是 来 自 


感官 的 感知 ， 以 及 大 脑 及 其 关于 外 部 世界 的 模型 在 预测 未 来 时 会 感知 到 什么 东西 的 








能 力 ， 甚 至 还 有 以 最 合 





适 的 方式 影响 这 些 感知 的 能 














根据 这 一 逻辑 ， 思 想 是 被 封闭 在 心智 (或 者 说 马尔 可 夫 和 覆盖 ) 内 部 的 一 种 构 
主观 的 。 因 此 ， 重 要 的 是 我 们 能 在 这 一 覆盖 上 获取 什 
么 ， 以 及 如 何 解 释 在 其 上 发 生 的 事情 。“ 外 部 世界 存在 ”这 一 假说 ， 就 像 我 们 生活 


造 ， 它 在 这 种 意义 上 必然 是 





在 类 似 《 黑 客 帝国 》 中 的 模拟 世界 的 假说 一 样 ， 














与 现实 主义 的 哲学 家 恰好 相反 ， 纯 粹 贝 叶 斯 主义 者 3 
部 客观 现实 存在 的 假说 中 。 





猫 存 在 于 二 进 制 代码 中 吗 ? 


并 没有 什么 规定 不 能 探讨 的 东西 。 











并 没有 盲目 地 将 置信 和 度 投入 外 














有 了 时候， 人 们 认为 在 大 脑 内 部 发 生 的 事情 与 马尔 可 夫 覆 盖 外 部 的 事情 相仿 。 
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你 养 的 猫 至 少 与 你 对 它 的 印象 一 样 真实 。 但 你 又 怎么 能 够 确实 认 知 到 这 一 点 呢 ? 
你 觉察 到 的 一 切 不 过 是 你 的 感官 探测 到 的 数据 ， 而 这 些 数据 也 只 不 过 关联 着 你 认 
为 对 应 “ 猫 的 存在 ”的 某 种 东西 。 
要 理解 这 一 点 ， 谷 歌 的 模拟 实验 尤为 有 意思 。 谷 歌 的 人 工 智能 最 终 构建 了 关 
于 猫 的 某 种 概念 ， 当 且 仅 当 人 工 智能 接收 到 的 信息 与 这 个 概念 相符 时 ， 概 念 本 刁 
才 会 被 激活 。 然 而 ， 这 个 人 工 智 能 实际 上 能 够 获取 的 信息 只 有 原始 数据 ， 也 就 是 
一 个 仅 由 0 和 1 组 成 的 庞大 文件 。 用 贝 叶 斯 主义 的 术语 来 说 ， 对 于 为 谷歌 的 人 工 
智能 接收 到 的 大 量 0-1 序列 建 模 来 说 ,“ 猫 的 存在 ”这 个 概念 相当 有 用 ， 也 正 因 如 
此 ， 人 工 智能 才 考 虑 了 这 个 概念 。 

同样 ， 如 果 将 弗 里 斯 顿 、 欣 顿 和 杰 恩 斯 的 假说 推 到 极端 ， 那 就 意味 着 我 们 每 
个 人 的 生命 完全 等 同 于 大 脑 读 取 自己 所 接收 到 的 海量 比特 的 过 程 。 在 这 个 模型 中 ， 
就 如 谷歌 的 人 工 智能 那样 ， 我 们 不 过 是 一 个 读 取 设备 ， 读 取 的 是 一 个 庞大 无 比 的 
数据 文件 ， 大 概 有 几 泽 字 节 (102 字 节 )， 而 我 们 的 读 取 速度 达到 了 惊人 的 儿 吉 字 
Td CIO FF) 每 秒 。 

最 引人入胜 的 一 点 是 ， 无 论 是 纯粹 贝 叶 斯 主义 者 还 是 实用 贝 叶 斯 主义 者 ， 读 
取 这 个 庞大 文件 都 会 引导 他 们 发 明 那 些 人 们 认为 真实 的 虚构 叙事 。 这 个 神奇 的 文 
件 可 以 媲美 最 伟大 的 著作 。 正 如 最 优秀 的 小 说 能 让 我 们 想象 出 虚构 世界 的 片段 ， 
这 个 神奇 的 文件 也 能 证 纯粹 贝 叶 斯 主义 者 和 实用 贝 叶 斯 主义 者 过 上 我 们 的 生活 ， 
而 且 与 我 们 自 认为 正在 度 过 的 岁月 一 样 真 实 。 

这 个 文件 的 神奇 之 处 主要 来 自 一 个 美妙 的 算法 性 质 ， 我 们 在 第 19 章 中 已 经 讨 
论 过 了 ， 那 就 是 文件 本 身 庞大 的 所 罗 门 诺 夫 复 杂 度 以 及 深 玩 的 本 内 特 逻 辑 深 度 。 
一 方面 ， 庞 大 的 所 罗 门 诺 夫 复杂 度 会 让 我 们 相信 特定 的 模型 ， 其 中 存在 着 我 们 自 
身 以 外 的 个 体 ， 还 会 令 我 们 发 展 出 各 种 精细 的 理论 ， 并 对 数学 进行 研究 。 另 一 方 
面 ， 深 选 的 逻辑 深度 会 驱使 我 们 相信 ， 解 释 自身 观察 结果 最 合适 的 方式 就 是 想象 
宇宙 的 目前 状态 是 一 段 悠长 的 计算 结果 ， 而 这 项 计算 的 出 发 点 就 是 一 个 远 远 没 有 
现在 这 么 复杂 的 物理 状态 。 

当然 ， 没 有 任何 证 据 可 以 保证 这 种 贝 叶 斯 大 脑 假设 的 极端 版 本 是 正确 的 。 作 
为 合格 的 贝 叶 斯 主义 者 ,我 们 应 该 注意 到 ， 这 也 只 是 一 个 虚构 的 叙事 。 但 “所 有 
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模型 都 是 错 的 "。 此 外 ， 这 一 假设 在 所 罗 门 诺 夫 妖 眼中 毕 竞 也 没有 那么 可 信 ， 因 为 
官 假设 存在 某 个 庞大 到 ZB 量 级 的 数据 文件 ， 确 实 相 当 过 火 。 











所 罗 门 诺 夫 妖 的 非 实 在 论 


其 实在 所 罗 门 诺 夫 妖 眼中 ， 与 这 个 庞大 的 数据 文件 相 比 ， 更 有 可 能 存在 的 是 
产生 这 个 文件 的 方法 。 回 忆 一 下 ， 所 罗 门 诺 夫 妖 相信 随机 算法 。 因 此 ， 数 据 文件 
本 身 不 过 是 更 基础 的 随机 算法 的 产物 ,算法 通过 随机 性 产生 了 这 个 文件 。 对 于 所 
罗 门 诺 夫 妖 来 说 ， 真 正 存 在 的 只 有 各 种 各 样 的 算法 和 这 类 虚构 叙事 的 生成 机 制 ， 
以 及 这 些 算法 所 依赖 的 无 法 描述 的 随机 性 。 

然而 ， 所 有 算法 可 以 被 看 作 “ 存 在 ”的 程度 也 并 不 相同 。 所 罗 门 诺 夫 妖 会 假 
设 某 些 算法 比 其 他 算法 更 可 靠 ， 然 后 不 断 尝 试 借助 贝 叶 斯 公式 调整 相关 的 置信 度 。 
换 名 话说， 所罗门 诺 夫 妖 大 体 上 只 会 相信 存在 某 种 算法 和 随机 性 的 释 加 结果 。 因 
此 ， 这 些 算 法 运行 时 的 中 间 步 又， 也 就 是 它们 讲述 的 虚构 叙事 ， 在 某 种 意义 上 也 
可 以 说 是 “存在 ”的 ， 即 使 这 种 存在 并 没有 算法 本 身 的 存在 那么 基础 。 对 我 来 说 ， 
这 个 令 人 目瞪口呆 的 说 法 就 是 贝 叶 斯 主义 的 结论 。 

昌 然 如 此 ， 我 并 没有 排除 这 一 论证 中 存在 缺陷 的 可 能 性 。 这 也 促使 作为 贝 叶 
斯 主义 者 的 我 不 要 将 所 有 置信 度 都 放 在 这 个 对 现实 的 奇怪 看 法 之 上 。 但 我 希望 ， 
这 能 让 你 稍稍 相信 “一 切 都 是 虚构 ” 或 许 ， 除 了 向 我 们 讲述 这 些 虚构 叙事 的 
算法 。 













































































怀疑 一 切 和 相信 一 切 是 两 种 同等 方便 的 办 
法 ， 因 为 两 者 都 无 须 思考 。 

FA] + HIR (1854—1912 ) 
第 一 个 原则 就 是 不 要 骗 自 己 一 一 你 自己 就 是 
最 好 骗 的 那个 人 。 

理 查 德 . 费 曼 (1918—1988 ) 





#2 l= 
信念 的 起 源 


发 散 级 数 的 奇闻 





当时 是 2013 年 6 月 6 日 ,午夜 钟 声响 过 了 6 分 钟 以 后 ,我 正在 读 一 篇 菲 夷 所 
思 的 文章 巾 。 昌 然 达 维 德 . 卢 阿 普 尔 持 有 理论 物理 学 的 博士 学 位 ， 但 他 在 自己 的 
博客 “惊奇 科学 ”( Science Etonnante ) 中 写 下 了 一 篇 博文 ， 似 乎 证 明了 所 有 正 整 
数 的 和 等 于 -1/12， 也 就 是 说 ，1+2+3+4+…= 一 1/12。 我 为 之 着 迷 ， 但 也 深 深 感 
到 困惑 。 我 必须 评论 一 下 。 

我 是 这 样 评论 的 :“ 这 篇 文章 太 棒 了 ! 我 不 明白 为 什么 人 们 尝试 构造 各 种 求 和 
方法 ， 而 不 是 尝试 利用 您 用 到 的 这 些 级 数 变换 规则 来 扩展 求 和 的 定义 。 利 用 某 些 
规则 ， 比 如 线性 性 质 和 向 级 数 添加 为 0 的 项 等 操作 ， 难 道 我 们 不 可 能 证 明 对 于 所 
有 可 以 通过 这 些 规则 得 到 的 数列 ， 都 存在 唯一 一 种 自然 的 求 和 结果 吗 ? 在 我 看 来 ， 
这 能 够 更 好 地 解释 1+2+3+4+…= 一 1/12 这 个 结果 ， 比 看 起 来 限制 性 太 大 的 切 萨 
罗 求 和 更 好 ， 也 优 于 解析 延 拓 之 类 的 技巧 ， 因 为 大 家 会 觉得 这 些 技巧 给 出 的 结 
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相当 随意 。” 

三 小 时 之 后 ， 达 维 德 ， 卢 阿 普尔 回复 了 我 的 评论 :“ 很 有 道理 ， 的 确 有 人 这 样 做 
了 。 人 们 尝试 找到 一 个 作用 在 数列 空间 上 的 算 子 S， 它 必须 是 线性 的 ， 在 数列 开头 
加 上 有 限 个 0 之 后 得 到 的 结果 也 相同 ， 而 且 与 绝对 收敛 级 数 的 通常 定义 相符 。 如 果 
我 们 假设 这 个 算 子 存在 ， 那 么 我 在 博文 中 写 下 的 那些 有 点 随意 的 变换 就 是 合法 的 ， 
我 们 也 会 发 现 1+2+3+4+… 的 唯一 可 能 取 值 就 是 -1/12， 但 是 还 需要 证 明 这 样 的 算 
子 〈 至 少 在 某 些 数列 上 ) 存在 ， 这 就 是 切 萨 罗 求 和 与 解析 延 拓 这 类 方法 的 意义 所 在 。 

于 是 ， 大 家 在 达 维 德 . 卢 阿 普尔 这 篇 博文 的 评论 区 里 展开 了 热烈 的 讨论 。 最 引 
人 注目 的 回复 来 自 雷 米 : 佩 尔 ， 他 证 明了 “不 存在 任何 发 散 级 数 的 ( 线性、 正则 及 稳 
定 的 ) 求 和 法 能 够 (对 所 有 正 整数 的 和 ) 给 出 有 限 的 结果 ”。 几 个 星期 之 后 ， 轮 到 我 
在 自己 的 博客 上 发 表 了 一 篇 博文 只， 其 中 证 明了 ， 虽然 达 维 德 . 卢 阿 普尔 的 变换 
无 法 得 出 1+2+3+4+…= 一 1/12 这 个 结论 ,但 可 以 得 出 1+2+4+8+16+…= 一 1。 

三 年 之 后 ，2016 年 9 月 8 日 ,我 上 传 了 一 段 视频 外 ,证 明了 所 有 可 以 通过 
非 重 心 型 的 线性 递 推 式 再 加 上 一 个 收敛 级 数 来 定义 的 级 数 了 都 能 以 唯一 的 方式 求 
和 ， 我 把 这 种 满足 线性 、 正 则 性 及 稳定 性 的 求 和 称 为 超 求 和 。 它 能 够 用 于 证 明 
大 量 令 人 人 惊叹 的 等 式 ， 比 如 1-1+1-1+…=1/2， 3+9+27+81+…=-3/2， 还 有 
2+3+5+8+13+21+…=-3。 此 外 ， 在 视频 的 结尾 ， 我 猜想 符合 这 些 条 件 的 级 数 
恰好 就 是 所 有 能 用 某 种 满足 之 前 条 件 的 方法 求 和 的 级 数 。 我 的 几 位 (可爱 的 ) dT 
阅 者 很 快 就 着 手 解 决 这 个 问题 ， 写 出 了 严谨 的 证 明 ! 

我 很 喜欢 这 段 故 事 ， 因 为 它 完美 地 描绘 了 (优秀 的 ) 研究 者 特有 的 那 种 好 奇 
Do 奇怪 的 结论 会 浇灌 求知 的 渴望 ， 以 至 于 众多 物理 学 家 对 意料 之 中 的 希 格 斯 玻 
色 子 的 发 现 其 实感 到 很 失望 。 但 最 重要 的 是 ， 人 研究 者 会 尽量 避免 得 出 结论 ， 还 会 
质疑 结果 的 依据 ， 以 及 自身 直觉 的 依据 。 就 像 伊 萨 克 ' 阿 西 莫 夫 所 说 的 :“ 科 学 
! 最 激动 人 心 的 话语 ， 也 就 是 预示 着 新 发 现 的 话语 ， 并 不 是 “我 发 现 了 ! " ， 而 是 















































































































































© 即 形 如 w+w+w+… 的 级 数 ， 其 中 每 一 项 wi 都 可 以 写成 wr =vi+wi， 其 中 wi 组 成 了 一 个 收敛 
级 数 ， 也 就 是 说 wi+wz+w+… 是 有 限 的 ， 而 ve 则 可 以 通过 前 几 项 的 数值 计算 出 来 ,也 就 是 
说 对 于 任意 的 大， 存在 常数 上 和 a, a, +, a, BRE vicam lta 729 av 一 r， 但 其 中 所 
有 上 恬 的 和 w+w+…+w 不 等 于 0。 一 一 译 者 注 
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“这 有 点 怪 啊 pps MG 

不 笠 的 是 ， 某 些 观众 的 反应 并 不 是 这 样 的 。 “您 写 出 的 方程 不 合 罗 辑 !” “我 觉得 
关于 无 限 的 计算 太 春 了 。 “无 限 求 和 没什么 用 。” 达 维 德 ， 卢 阿 普尔 的 博文 也 收 到 了 
大 量 类 似 的 回复 。 "这 篇 博文 真是 春 得 过 分 。 “这 种 假装 严谨 的 “证 明 ” 把 我 都 看 笑 
了 。“ 这 不 是 惊奇 的 科学 ， 而 是 随手 乱 写 的 伪劣 证 明 !” 对 于 这 些 粗暴 的 留言 ， 达 维 
德 ， 卢 阿 普尔 也 很 惊讶 。 他 这 样 写 道 : "我 没 想 到 这 篇 博文 会 让 那么 多 读者 倒戈 相向 。 
































但 那 是 错 的 ， 不 是 吗 ? 


请 你 也 思考 一 下 。 在 读 到 1+2+3+4+…= 一 1/12 的 时 候 ， 你 有 没有 惊讶 得 跳 
起 来 ?如 果 我 跟 你 说 勾 股 定理 错 了 的 话 ， 你 会 有 什么 反应 ? 如 果 我 说 , 只 是 冒名 
顶替 呢 ? 引力 并 不 存在 呢 ? 地 表 在 向 上 加 速 移动 呢 ? 与 通过 杂交 得 到 的 品种 相 比 ， 
通过 CRISPR 基因 编辑 技术 得 到 的 转基因 作物 无 论 对 人 体 还 是 对 生物 多 样 性 来 说 
都 更 有 益 呢 ?物理 学 家 达成 了 光子 ( 量子 状态 ) 的 瞬间 转移 呢 ? 存在 并 非 有 限 也 
并 非 无 限 的 集合 呢 ? 

和 否定 那些 违反 直觉 的 奇怪 假说 不 算是 个 坏 习惯 一 一 虽说 仅仅 因为 碰 到 这 种 假 
说 就 一 脸 敌 意 也 不 可 取 。 如 果 我 跟 你 说 ， 我 轻 轻 松 松 就 登 上 了 喜马拉雅 山脉 上 的 
一 座高 峰 ， 即 使 你 不 相信 我 ， 我 也 不 会 责怪 你 。 在 前 儿 章 里 ,我 甚至 还 在 为 偏见 
辩护 。 不 要 浪费 太 多 时 间 去 仔细 思考 那些 我 们 完全 有 理由 认为 没什么 前 途 的 想法 。 

同样 ， 过 去 的 智者 与 大 型 团体 为 了 让 自己 看 起 来 更 可 信 ， 会 激烈 反对 那些 他 
们 觉得 过 于 违反 直觉 的 想法 。 传 说 毕 达 哥 拉 斯 学 派 淹 死 了 可 怜 的 希 帕 索 斯 ， 因 为 
他 证 明了 V2 是 个 无 理 数 ; 1632 年 ， 耶 稣 会 ”禁止 数学 中 的 无 穷 小 计算 由 ; 19 世纪 
K, RIKE + 康 托 尔 提出 的 无 限 集合 引 来 了 同时 代 人 的 哄笑 ， 尤 其 是 来 自 利 奥 
波 德 ， 克 罗 内 克 的 猛烈 批评 ， 他 用 到 了 类 似 “ 招 摇 撞 骗 ”“ 叛 徒 ” 和 “腐蚀 青年 
人 ”等 侮辱 性 的 字眼 ; 即使 到 了 20 世纪 70 AAC, SR EP BA EE, 
粗糙 不 平 的 新 几何 结构 也 被 同时 代 的 许多 著名 数学 家 激烈 攻 计 ， 对 他 们 来 说 ， 真 
正 的 几何 结构 应 该 是 平滑 、 连 续 、 可 微分 的 外 。 然而， 在 所 有 这 些 例子 当中 ， 数 


”耶稣 会 是 天 主教 会 的 著名 修 会 之 一 ， 以 保守 而 著称。 一 一 译 者 注 
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对 新 想法 的 否定 一 直 持 续 下 去 ， 而 是 一 步 一 步 最 终 改变 了 想法 ， 从 
! 烧 变 成 了 今天 的 焚香 供奉 。 今 天 ，V2 CES 





EPE, JETE JE RIAIR 

宝 。 即 使 是 

1+2+3+4+…= 一 1/12 这 个 等 式 ， 最 终 也 有 顶尖 数学 家 为 其 辩护 ， 比 如 斯 里 尼 瓦 

B MEZE, KIE 哈 罗 德 :哈代 和 陶 哲 轩 四 。 人 们 有 时 候 会 说 ， 数 学 这 门 

科学 能 够 扫 清 疑问 、 分 辩 真 假 ， 那 么 其 中 怎么 可 能 发 生 这 样 的 思想 转变 呢 ? 数学 
家 是 怎么 知道 自己 错 了 的 ?又 是 什么 让 他 们 





分 、 康 托 尔 的 无 限 集合 以 及 曼 德 尔 布 罗 的 分 形 都 被 视 为 数学 中 的 珍 


























] 回 心 转 意 ? 


























“新 的 科学 真理 最 终 取得 胜利 ， 靠 的 不 是 说 服 反 对 者 并 让 他 们 理解 ， 而 是 因为 
这 些 反 对 者 最 后 都 死 了 ， 而 熟悉 这 个 真理 的 新 一 代 成 长 了 起 来 。” 物理 学 家 马克 
Jr + 普 朗 克 曾 这 样 断 言 。 根 据 数 十 年 的 心理 学 实验 结果 ， 心 理学 家 多 米 尼克 … 约 
VER 











I 詹姆斯 . 福 勒 这 样 补充 道 :“ 人 类 有 着 众多 的 认 知 偏差 .但 其 中 最 常见 、 最 
严重 也 最 普遍 的 就 是 自信 过 度 。” 科 学 家 也 无 法 免 于 这 种 自 

往往 只 有 少数 人 会 花 精力 去 型 

是 那些 尝试 思考 自 














信 过 度 。 


E 解 其 他 人 得 出 某 个 结论 的 理由 ， 而 更 少见 的 就 
己 为 什么 会 做 出 某 种 思考 的 人 。 而 这 本 书 的 主要 
来 推 


是 引导 你 仔细 思考 是 什么 原因 使 你 做 出 了 某 种 思考 ! 我 自己 之 前 就 花 了 很 长 时 间 








an 





目的 之 一 , E 
个 问题 。 





， 为 什么 我 会 持 有 某 种 想法 。 符 运 的 是 ， 我 人 生 中 的 几 件 大 引 
我 希望 我 个 人 的 思考 可 以 作为 例子 





EASI T 3x 
让 你 也 去 思考 这 个 问题 。 
军官 学 生 





在 有 幸 入 读 法 国 巴 黎 综合 理工 学 院 之 后 ， 我 被 “心计 ”软件 送 到 了 位 于 法 国 
圣 西 尔 的 网 








一 边 声 

















和 军 学 校 一 一 我 可 以 向 你 保证 ， 我 真 的 想 去 那里 ， 而 不 是 被 “心计 ” 算 


HT! 这 是 一 段 痛苦 的 经 历 : 我 每 天 早上 在 太阳 升 起 之 前 就 要 疏 起 来 清扫 而 所 ， 
斯 力 竭 地 唱歌 一 边 行 军 好 几 个 小 时 ， 我 还 在 十 二 月 的 雨中 在 布 列 塔 尼 和 森林 
的 战壕 里 过 夜 。 当 时 真是 艰苦 。 

但 平 心 而 论 ， 这 是 一 段 很 有 意义 的 经 历 。 仅 仅 过 了 几 个 与 


意识 到 的 情况 下 学 会 了 军队 的 姿态 和 价值 观 。 我 开始 用 干巴 巴 的 方式 说 话 ， 夸 大 
将 衣服 折 成 A4 纸张 大 小 的 寻 





EH], ， 我 在 没有 完全 








要 性 。 我 整 天 大 谈 指挥 的 艺术 ， 而 且 认定 决断 显然 比 
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REX, Dr 
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9 糕 的 是 ， 我 没有 意识 到 正 是 这 个 情境 迫使 我 对 这 
些 新 想法 深信 不 疑 。 我 当时 不 理解 为 什么 自己 会 开始 相信 这 些 信 和 念 ， 


也 没有 意识 





到 整个 环境 在 什么 程度 上 决定 了 我 的 思考 。 





万 幸 的 是 ， 我 这 段 短暂 的 军旅 生涯 很 快 就 走 到 了 尽头 。 








回 到 巴黎 综合 理工 学 








院 之 后 ， 我 进入 了 完全 不 同 的 情境 一 一 学 生生 活 开 始 了 。 我 又 暴露 在 新 的 姿态 、 


价值 观 和 “ 牌 理 ”之 中 。 但 这 
在 军队 直到 的 价值 观 有 所 抵触 ， 这 最 终 让 我 开始 考虑 自身 怀 有 的 信念 


这 大 概 是 我 在 人 生 中 头 一 次 这 样 做 。 
然而 随 着 年 龄 的 增长 ， 我 偶尔 会 因为 发 现 自身 信念 暗藏 的 来 源 而 感到 惊讶 。 


我 理解 到 了 自己 对 指挥 、 领 导 和 承担 责任 的 向 往 其 实 来 自 众 多 针对 巴黎 综合 理工 
无 论 这 些 演讲 来 自 校外 的 演讲 者 还 是 





学 院 的 学 生 的 演讲 ， 











一 次 我 有 了 质疑 的 权利 。 





这 些 新 的 价值 观 经 常 与 我 
:的 来 源 问题 
然而 ， 这 段 时 期 很 短暂 ， 也 很 不 足 。 




















高 级 军官 。 校 方 开设 了 


关于 领导 力 的 课程 ， 鼓 励 我 们 进行 多 人 合作 的 课题 ， 向 我 们 淮 输 企业 家 的 荣耀 感 ， 





F 


其 
是 应 用 数学 ， 
现在 回首 ， 





析 考 察 研 究 小 组 ( 简称 GERAD ) 这 个 优秀 的 研究 团队 真是 


至 使 我 在 从 巴黎 综合 








研究 、 











理工 学 院 毕业 的 时 候 认 为 ， 如 果 要 研究 数学 的 话 ， 那 只 能 
而 且 这 样 做 必须 能 够 让 我 终 有 一 天 在 企业 中 登 上 高 位 才 行 。 
我 只 觉得 自己 后 来 遇 到 了 加 拿 大 蒙特 利 尔 综合 理工 学 校 的 决策 分 





SERP, EX NS 





数学 和 脑力 劳动 的 新 环境 中 








， 我 突然 获得 了 新 的 价值 观 和 信念 。 











生活 在 加 拿 大 蒙特 利 尔 而 不 是 法 国 ， 大 大 改变 了 我 获取 新 闻 的 方式 。 我 的 家 


里 不 再 摆 痢 电视 ， 花 在 网 上 浏览 法 国 新 闻 的 时 间 也 越 来 越 少 。 
息 来 源 并 理解 这 些 来 源 如 何 影响 我 的 信念 





所 有 我 关于 法 国 的 信 ， 




















自 此 之 后 ， 要 列 出 
得 容易 多 了 。 








在 2011 年 末 的 一 天 ， 当 时 2012 年 法 国 总 统 选举 的 社会 党 初 选 正 将 拉 开 帷幕 ， 


我 惊讶 地 发 现 ， 我 断定 自己 不 喜欢 马 带 娜 ， 





惊讶 。 我 最 终 察 觉 到 了 自身 信念 
会 有 着 这 样 的 想法 : 我 当时 在 收看 一 


地 发 现 跟 我 讨论 过 
相关 信息 





\ 比 我 多 ? 还 
接受 害 者 ? 说 到 底 ， 


十 的 其 他 人 都 意见 





X 














© 法 国 一 档 











] 木 偶 表 演 的 讽刺 节目 。 一 一 译 者 注 


中 的 一 个 疑问 ， 而 我 一 




















奥 布 里 。 我 同样 惊喜 于 发 现 自己 为 此 
瞬间 就 明白 了 自己 为 什么 
档 叫 Les Guignols” 的 电视 节目 。 我 同样 惊讶 
一 致 ， 并 对 此 非常 满意 。 是 不 是 这 些 人 知道 的 

















还 是 说 他 们 跟 我 一 样 ， 都 是 电视 节目 的 嘴 外 之 音 的 直接 或 者 间 
又 有 谁 真正 认识 这 些 政治 人 物 ? 
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我 的 亚洲 之 旅 

















2012 年 初 是 我 的 个 人 思考 之 中 最 重要 的 时 刻 之 一 。 在 开始 攻读 博士 之 前 ， 我 
背 着 背包 ， 和 一 位 朋友 一 起 走 上 了 历时 一 个 半月 的 亚洲 游历 旅程 。 无 论 是 在 地 理 、 
人 文 还 是 思想 方面 ， 这 都 是 一 段 美妙 的 旅程 。 

令 我 印象 最 深 的 事件 之 一 就 是 我 在 一 份 报纸 上 读 到 的 一 篇 文章 ， 它 讲 的 是 某 位 
企业 负责 人 因为 非法 集资 被 判 死刑 。 令 我 惊异 的 是 ， 文 章 的 立场 非常 慎重 、 平 衡 。 
文章 的 一 半 内 容 为 死刑 辩护 ， 而 另 一 半 内 容 则 谴责 死刑 。 我 对 此 非常 困惑 。 我 之 
前 读 过 的 有 关 死 刑 的 资料 几乎 没有 如 此 审慎 。 更 糟糕 的 是 ， 法 国 的 教育 让 我 沉浸 
在 对 于 死刑 的 激进 反对 之 中 。 这 要 归功 于 维 克 多 “' 雨 果 的 著作 ， 他 写 的 《死刑 犯 
的 最 后 一 天 》( Le Dernier Jour d'un Condamné ) 是 令 我 印象 最 深刻 的 书籍 之 一 。 

我 讲 这 段 话 并 不 是 为 了 支持 或 反对 死刑 一 一 对 我 来 说 ， 法 庭 对 贝 叶 斯 公式 的 
ÉD RATE + 肖 的 工作 就 是 反对 死刑 不 容 置 疑 的 论据 。 我 讲 这 个 故事 是 为 了 
分 享 一 件 事 ， 就 是 我 突然 意识 到 ， 自 身 的 意识 形态 立场 是 由 长 久 以 来 单一 的 斗争 
运动 引导 而 成 的 。 我 之 所 以 有 这 样 的 想法 ， 是 因为 我 的 社会 、 文 化 和 教育 环境 促 
使 我 这 样 思考 。 从 历史 意义 来 说 非常 讽刺 的 是 ， 我 最 终 意识 到 法 国 的 学 校 以 及 我 
的 法 国 同胞 大 体 决 定 了 我 自身 的 信念 。 

在 这 件 事 发 生 的 几 天 之 前 ， 我 和 朋友 当时 置身 于 一 个 尴 众 的 境地 。 我 们 刚刚 到 
达 黄 山 市 屯 溪 区 ， 打 算 探 索 一 下 黄山 。 但 当时 农历 新 年 才 过 了 几 天 ， 从 屯 溪 到 香港 
的 列车 已 经 满员 。 问 题 在 于 ， 我 们 已 经 买好 了 三 天 之 后 从 香港 出 发 的 机 票 ， 而 且 我 
会 的 唯一 一 名 中文 就 是 “我 不 会 说 中 文 ”……: 在 这 种 紧迫 的 情况 下 ， 我 们 几经 波折 ， 
在 绝望 中 打 着 手势 ， 最 终 多 花 几 百 欧元 买 到 了 从 黄山 屯 溪 机 场 前 往 香港 的 机 票 。 
们 重新 踏 上 了 登 黄山 的 旅途 ， 但 如 此 高 晶 的 机 票 价格 让 我 们 兴致 全 无 。 

要 到 黄山 ， 我 们 必须 搭乘 一 辆 面包 车 ， 需 要 付 160 元 ， 也 就 是 大 约 20 欧元 。 这 
个 价格 在 当时 实在 高 得 吓人 。 我 们 已 经 没有 别 的 选择 了 ， 只 好 接受 。 面 包车 出 发 了 ， 
我 们 坐 在 车 里 ， 等 到 了 付费 的 时 刻 ， 看 到 别 的 乘客 付 钱 的 时 候 ， 我 们 才 突 然 明 白 之 前 
的 沟通 出 了 点 问题 ! 我 们 需要 付 的 不 是 160 元 ， 而 只 是 16 元 ， 也 就 是 大 约 2 欧元 ! 

我 特别 记得 我 们 脸 上 绽 出 的 那个 大 大 的 笑容 ， 就 好 像 我 们 刚才 签 下 了 划时代 
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的 条 约 ! 但 这 种 发 自 内 心 的 愉悦 显然 非常 可 笑 。 我 们 刚刚 损失 了 几 百 欧元 
们 当时 的 心情 竟然 是 被 省 下 几 十 欧元 的 错觉 决定 的 ! 我 体验 到 了 锚 定 效应 ， 
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LÉ 
BE 


我 的 心情 是 如 何 强烈 依赖 于 社会 强加 的 规范 的 。 


都 是 因为 魔鬼 获得 了 权力 ? 


我 们 在 那里 看 到 了 美国 大 兵 照 片 


两 周 之 后 ， 在 同一 趟 亚洲 之 旅 














， 但 我 
还 有 


P， 我 们 探访 了 越南 胡志明 市 的 战争 博物 馆 。 
的 残暴 行为 以 及 令 人 发 指 的 记述 。 短 短 几 年 间 ， 








在 这 片 相对 狭窄 的 土地 之 上 投放 的 炮弹 数量 超过 了 整个 第 二 次 世界 大 战 。 
己 会 采取 不 同 的 行动 ， 成 为 同情 心 和 正义 的 榜样 。 然 而 现代 
心理 学 却 确 切 指出 这 不 过 是 种 幻觉 。20 世纪 60 年 代 ， 在 一 个 后 来 出 了 名 的 实验 之 


Lu 


人 们 倾向 于 认为 自 























斯 坦 利 ， 米尔 格拉 姆 要 求 被 试 A 在 被 试 B 














回答 问题 错误 时 惩罚 后 者 ， 被 试 A 


和 被 试 B 通过 话 简 交 流 ， 而 惩罚 的 形式 是 电击 。 令 人 不 安 的 是 ， 当 一 位 研究 者 下 
达 命令 ， 要 求 将 电击 的 电压 逐步 提高 到 超过 被 认为 会 致死 的 冰 值 时 ， 三 分 之 二 的 
被 试 A 会 几乎 盲目 地 遵循 这 些 命 
电压 旁边 有 一 个 显眼 的 代表 死亡 的 骼 通 头 标志 。 此 外 ， 话 简 另 一 头 的 被 试 B 实际 


上 都 是 演员 ， 他 们 发 出 垂死 般 的 尖 
仍然 进行 了 ( 其 实 是 自 
H (1&5) (The Heist ) 


别人 的 指令 ， 
朗 也 在 电视 节 





























令 。 这 些 被 试 A 不 能 以 不 知情 为 借 




















口 ， 因 为 致死 





叫 和 黑 喊 。 尽 管 如 此 ，67% 的 被 试 A 单单 出 于 
己 觉得 进行 了 ) 致死 性 的 电击 ?。 近 年 德 伦 布 
重复 了 这 项 实验 ， 得 到 了 相似 的 结果 。 

















我 们 当中 的 大 部 分 人 会 迅速 届 从 于 社会 压力 和 权力 机 关 。 如 果 说 在 某 些 情况 
下 我 们 一 开始 会 抵抗 ， 








La 
外 。 


SAKE, AARTI 





CD WAI KARE KER DIETE, TEKH 
实验 中 的 电击 并 不 会 给 被 试 B 造成 伤害 ,月 























实际 上 大 多 数 





计 上 都 极 不 规范 ， 不 符合 现代 心理 学 的 标准 。 
在 符合 现代 实验 标准 的 前 提 下 ， 研 究 人 员 同 样 发 现 有 类 
然 也 没有 那么 符 人 听闻 





验 指出 的 那么 高 ， 当 




















HE A 




















PAP NIA A 
i 以 这 些 被 坛 的 测试 数据 应 该 作废 。 剩 下 的 被 坛 A 
约 66% ) 没有 服从 指令 。 此 外 ， 实 验 本 身 无 论 在 伦理 、 实 验 过 程 还 是 数据 统 


日 是 随 着 时 间 流 逝 ， 我 们 最 终 一 般 还 是 会 放弃 。 跟 看 上 去 
觉 的 是 ， 我 看 不 出 来 有 什么 理由 认为 自 
不 幸 的 是 ， 我 觉得 在 这 种 不 寻常 的 情况 中 ,我 也 几乎 必定 ( 觉得 自 


己 会 是 例 


己 ) 会 对 


Li 





已 经 当场 发 现 











IR, MAREA T 




















o 一 一 译 者 注 





究 人 类 对 权威 服从 的 实验 ， 


以 的 现象 ， 但 程度 没有 米尔 格拉 姆 实 
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别人 进行 致死 性 的 电击 。 
幸运 的 是 ， 随 机 性 让 我 生活 在 与 此 不 同 的 条 件 之 中 。 





故事 比 数字 更 有 效果 





我 们 的 善良 能 否 经 受 所 有 考验 ? 认 知 科学 的 统计 数据 相当 不 利 。 然 而 不 季 的 
是 ， 人 们 往往 记 不 住 这 样 的 统计 数据 ， 更 不 要 说 应 用 贝 叶 斯 公式 来 根据 统计 数据 
调整 自身 的 贝 叶 斯 置信 度 了 。 但 最 突出 的 问题 ， 还 是 人 们 不 认为 这 些 统计 数据 对 
于 自己 认识 的 人 同样 成 立 ， 更 不 认为 这 些 数据 可 以 用 在 自己 映 上 。 

心理 学 家 理 查 德 . 尼斯 比特 和 尤 金 ' 博 尔 吉 达 所 做 的 一 系列 实验 恰好 证 明了 这 一 
点 。 责 任 扩散 效应 是 认 知 科学 确立 的 事实 之 一 。 比 如 ， 一 项 经 典 实验 就 证 明了 ， 当 被 试 
知道 还 有 别人 可 能 会 伸 出 援手 的 时 候 ， 只 有 27% 的 人 会 去 帮助 一 位 在 地 上 抽 搞 的 患者 。 
这 个 事实 令 人 震惊 ! 我 们 倾向 于 觉得 我 们 之 中 有 更 大 比例 的 人 会 去 帮助 身 处 危险 的 人 。 

但 尼斯 比特 和 博 尔 吉 达 研究 的 并 不 是 这 个 现象 。 他 们 想 知 道 ， 对 于 被 采访 者 
会 不 会 帮助 患者 ， 那 些 已 经 知道 27% 这 个 数字 的 学 生 的 猜测 会 不 会 更 准确 。 令 二 
人 讶 异 的 是 ,答案 是 否定 的 。 知 道 一 个 惊人 的 统计 事实 并 不 能 使 预测 更 准确 ， 即 
使 这 项 统计 理应 对 预测 有 帮助 。 这 些 学 生 的 确 记 住 了 这 个 数字 一 一 他 们 可 以 在 考 
试 中 把 它 背 出 来 ,但 他 们 无 法 将 这 个 数字 用 到 实践 中 。 

同样 奇怪 的 是 ， 如 果 向 学 生 展 示 那 些 没 有 帮助 患者 的 人 的 个 别 例子 ， 那 么 学 生 
就 能 成 功 将 责任 扩散 的 统计 数据 内 化 。 尼 斯 比特 和 博 尔 吉 达 在 总 结 他 们 的 研究 时 ， 
写 下 了 这 个 评注 :“ 被 试 不 愿意 将 一 般 情况 应 用 到 特殊 情况 ， 正 如 他 们 乐意 从 特殊 ' 
况 推 出 一 般 情 况 。” 这 一 评注 值得 所 有 学 习 者 、 教 育 者 或 者 从 事 沟 通 工 作 的 人 深思 。 

因此 ， 当 我 和 朋友 谈论 政治 、 心 理学 或 者 社会 学 的 时 候 ， 他 们 通常 会 用 自己 
或 者 熟人 的 经 验 来 肯定 或 否定 科学 分 析 。 然 而 ， 这 些 特 殊 例 子 通常 染 上 了 浓烈 的 
感情 色彩 ， 并 且 挫 杂 了 回忆 导致 的 错误 ， 当 面 对 政 治学 家 、 社 会 学 家 和 心理 学 家 
的 统计 分 析 时 ， 这 些 例子 简直 一 钱 不 值 。 这 种 通过 摆脱 特殊 情况 来 对 一 般 情况 进 
行 推断 的 必要 性 ， 正 是 社会 科学 的 主要 难点 之 一 。 

然而 令 人 困扰 的 是 ， 即 使 向 学 生 讲授 这 些 普 遍 的 情况 也 几乎 不 会 改变 学 生 的 
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置信 度 ， 要 真正 考验 学 生 的 置信 和 度 就 必须 展示 具体 实例 。 正 因 如 此 ， 本 章 专门 描 
述 了 我 探寻 自身 信念 来 源 的 例子 ， 它 揭示 了 我 的 认 知 中 的 偏差 与 局 限 。 我 希望 我 
的 具体 实例 能 够 帮助 你 更 好 地 将 你 周围 的 人 的 认 知 局 限 推广 到 一 般 情 况 ， 并 且 帮 





























助 你 预计 自身 的 认 知 局 限 性 。 





























即使 手 握 大 量 事 例 ， 确 定 自身 的 认 知 局 限 仍 然 极其 困难 。 即 使 伟大 如 丹 尼 
尔 . 卡 内 曼 ， 他 虽然 拥有 一 切 相 关 的 专业 知识 ， 但 仍然 不 能 免 俗 ,无 法 利用 普遍 
情况 推断 具体 情况 。 在 说 服 当局 在 中 学 开设 决策 心理 学 课程 之 后 ， 卡 内 曼 召 集 了 
一 文 团队 来 编写 这 门 新 课程 的 大 纲 。 卡 内 曼 询 问 团队 中 的 每 位 成 员 ， 估计 编写 这 








门 课程 的 完整 教科 书 需要 多 长 时 间 。 
































他 收 到 的 答复 都 在 一 年 半 和 两 年 半 之 间 。 





然后 ， 卡 内 曼 询 问 课程 编写 专家 西 摩 ， 和 希望 知道 其 他 团队 在 类 似 的 项 目 





























花 











费 了 多 长 时 间 。 西 摩 十 分 为 难 ， 因 为 他 给 出 的 答复 与 他 自己 非常 熟悉 的 统计 数据 
完全 脱节 。 西 摩 表 示 ， 类 似 的 项 目 大 约 有 40% 最 终 失 败 ， 而 其 余 的 项 目 至 少 要 花 
7 年 才能 完成 ! 西 摩 甚 至 还 补充 了 一 点 ， 平 均 来 将， 其 他 项 目 在 一 开始 的 时 候 表 现 



































得 至 少 跟 卡 内 曼 的 项 目 一 样 好 。 卡 内 曼 的 团队 严重 低 佑 了 任务 有 多 艰巨 。 


但 这 还 不 


还 不 是 
身 的 置信 和 度 ， 觉 











最 令 人 吃惊 的 。 现 在 ， 卡 内 曼 拥 有 了 这 些 新 数据 ， 他 应 该 更 新 自 
察 到 这 一 项 目 会 浪费 大 量 时 间 ， 而 且 失 败 的 可 能 性 也 很 高 。 他 本 






































应 因此 放弃 这 一 项 目 ， 但 放弃 一 个 项 目 难 于 登 天 中。 即使 是 卡 内 曼 这 位 研究 决策 
的 专家 ,也 没有 花 时 间 考 虑 项 目 本 身 极 有 可 能 失败 ， 仍 然 勉强 推进 这 个 项 目 。 这 














本 教材 终于 在 8 年 之 后 由 卡 内 曼 的 后 继 者 完成 ， 然 后 就 被 束之高阁 。 

我 们 常见 的 认 知 偏差 之 一 就 是 动机 性 推理 ( motivated reasoning )。 我 们 通常 会 
从 想 要 得 到 的 结论 出 发 ， 推 理 对 我 们 来 说 不 过 是 一 件 工 具 ， 让 我 们 能 坚定 地 相信 
这 个 自己 早已 接受 的 结论 。 卡 内 曼 希 望 自己 的 项 目 会 成 功 ， 因 此 毫 不 犹 光 地 忽略 








了 那些 本 应 引起 疑虑 的 统计 数据 。 








心理 学 家 乔纳森 海 特 用 “直觉 先行 ,然后 说 理 ” 这 种 说 法 来 概括 这 一 现象 。 
在 所 有 争论 之 中 ,我 们 都 是 先 选择 立场 ， 之 后 才 解 释 自己 的 决定 。 推 理论 证 只 是 
为 了 由 结果 推出 原因 。 这 就 是 所 谓 的 合理 化 ， 而 根据 海 特 的 说 法 ， 我 们 整 天 都 是 








这 么 思考 的 。 我 们 思考 的 方式 就 像 和 








# 师 ， 而 客户 就 是 我 们 的 直觉 。 








问题 在 于 ， 这 样 做 会 让 我 们 倾向 于 夸大 那些 有 利于 自身 的 论据 ， 扫 除 那 些 不 
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利于 我 们 的 结论 的 论据 。 我 们 一 般 会 怀疑 那些 挑战 我 们 的 结论 的 信息 来 源 ， 尤 其 
会 质疑 这 个 信息 来 源 的 能 力 与 动机 。 这 就 是 著名 的 选择 偏差 。 但 在 互联 网 时 代 ， 
无 论 我 们 的 结论 是 什么 ,谷歌 让 我 们 总 能 找到 支持 这 个 结论 的 博客 或 者 视频 。 








心理 作用 


此 外 ,对 直觉 的 合理 化 就 足以 解释 迷信 的 出 现 。 心 理学 家 伯 勒 斯 * 斯 金 纳 就 
曾 用 一 个 关于 蚀 子 迷信 行为 的 有 趣 实验 完美 地 注解 了 这 一 点 。 我 们 之 前 已 经 看 到 ， 
斯 金 纳 曾经 通过 在 角子 正 确 执行 书面 指令 时 给 予 奖励 的 方法 ， 成 功 训练 铝 子 阅读 
“ 咏 ” 和 “转圈 ”等 单词 。 引 人 注目 的 是 ， 这 些 铝 子 很 快 就 学 会 了 阅读 。 

但 当 斯 金 纳 将 铝 子 放 在 笼子 里 ， 在 没有 指令 的 情况 下 不 定时 给 予 饮 子 奖励 的 时 
修 ， 这 个 实验 才 真 正 有 趣 起 来 。 这 些 饮 子 尝试 了 各 种 各 样 的 动作 ,希望 这 些 动作 会 带 
来 奖励 。 显 然 ， 当 奖励 出 现 的 时 候 ， 铝 子 刚 好 做 完 或 者 正在 做 特定 的 动作 。 然 后 铝 子 
就 会 过 度 解 读 它 们 观察 到 的 相关 性 ， 自 以 为 正 是 这 个 动作 带 来 了 奖励 。 它 们 接 下 来 就 
会 一 次 又 一 次 重复 这 个 动作 ,但 它们 重复 这 个 动作 的 次 数 越 多 ， 在 动作 进行 期 间 奖励 
出 现 的 概率 也 越 大 ， 这 就 巩固 了 铝 子 错误 的 信念 。 斯 金 纳 的 铝 子 学 会 了 迷信 行为 ! 

人 们 也 许 想 要 认为 这 些 蚀 子 就 是 白痴 ， 但 我 要 提醒 一 句 ， 这 些 饮 子 在 蒙 
带 . 霍 尔 游戏 中 的 表现 比 人 类 的 表现 更 好 ! 所 以 我 们 可 以 打赌 ， 让 这 些 馈 子 学 习 
到 迷信 行为 的 机 制 在 人 类 身上 也 适用 。1985 年 ， 特 沃 斯 基 、 吉 洛 维 奇 和 瓦 伦 证 明了 
篮球 比赛 中 所 谓 “ 热 手 效应 ”的 说 法 ， 也 就 是 球员 有 可 能 在 某 些 日 子 里 状态 特别 
好 、 做 什么 都 一 切 顺利 的 现象 ， 其 实 不 过 是 一 种 迷信 。 这 三 位 研究 者 的 统计 分 析 
得 出 了 相反 的 结论 ， 也 就 是 所 有 球员 的 成 功 投球 都 遵循 最 基本 的 纯粹 随机 分 布 ”。 














































































































© 根据 近年 来 的 重新 研究 ， 人 们 发 现 这 三 位 研究 者 的 统计 分 析 有 雇 误 。 在 重新 分 析 之 后 ， 人 们 
得 出 了 “ 热 手 效应 ”似乎 存在 的 结论 ， 虽然 效应 本 身 的 强度 要 比 人 们 所 认为 的 弱 得 多 。 但 
“ 热 手 效应 ”背后 有 可 能 的 机 制 可 以 解释 ， 比 如 球员 当日 心理 状态 就 是 一 个 混杂 变量 ， 可 能 改 
变 投 球 的 总 体 成 功率 。 根 据 贝 叶 斯 主义 的 方法 论 ， 这 并 不 令 人 意外 。 但 对 于 许多 纯粹 依靠 随 
机 性 的 做 法 ， 比 如 说 抽签 和 签 杯 等 ， 就 不 存在 可 信 的 机 制 ， 除 了 心理 影响 以 外 没有 任何 实际 
效应 。 此 外 ， 早 有 坚实 的 实验 证 明 一 些 迷信 系统 ， 比 如 西方 的 占星 术 ， 并 不 能 预见 未 来 ， 只 
是 通过 心理 作用 影响 人 们 的 行为 。 一 一 译 者 注 
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特别 是 ,一 串 独 立 的 随机 变量 之 中 存在 一 长 串 取 值 相同 的 变量 的 概率 大 得 

因此 ， 人 类 社会 中 存在 迷信 现象 ， 不 一 定 需要 超自然 的 解释 。 只 需要 结合 统 
计 法 则 ， 以 及 我 们 无 法 正确 应 用 哪怕 是 近似 版 的 贝 叶 斯 公式 这 一 事实 ， 就 足以 预 
言 会 存在 大 量 迷 信行 为 。 这 就 是 为 什么 超自然 现象 的 亲历 记述 并 不 会 增加 贝 叶 斯 
主义 者 对 于 超自然 现象 的 置信 度 ， 因 为 无 论 超 自然 现象 存在 与 否 ， 我 们 都 同样 会 
预期 存在 这 些 亲 历 记述 。 





















































意识 ABA 尔 文 式 演化 








在 探访 金边 几 天 之 后 ， 我 们 就 出 发 去 游览 柬埔寨 吴 哥 的 寺庙 。 何 等 巧夺天工 ! 
众多 寺庙 精 雕 细 琢 ， 加 上 周围 充满 野趣 的 自然 ， 令 人 印象 深刻 。 其 中 最 大 的 寺庙 
吴 哥 富 尤 其 宏伟 ， 有 人 说 兽 有 30 万 名 工人 和 6000 只 大 象 参与 到 这 座 庞然大物 的 
建造 当中 ， 总 共 花 费 了 37 年 。 实 在 难以 置信 ， 这 怎么 可 能 ? 怎么 可 能 在 37 年 间 
协调 30 万 名 工人 的 工作 ? 更 何况 在 那个 时 代 ， 人 们 还 不 能 用 互联 网 互相 联络 ! 

但 不 久之 后 在 泰国 阿 瑜 陀 耶 ， 我 才 遇 到 这 场 亚 洲 之 旅 中 最 使 我 思潮 滚 涯 的 地 
方 。 在 目不转睛 地 有 盯 着 各 种 佛像 时 ， 我 突然 理解 到 信念 穿越 时 间 和 空间 传递 的 方 
式 就 像 生物 物种 一 样 。 不 同 的 信念 一 直 在 无 休止 地 竞争 ， 目 的 是 占据 人 类 宿主 的 
心灵 。 在 这 场 游戏 中 ， 那 些 保留 下 来 的 信念 ， 也 就 是 时 至 今日 仍然 有 人 知道 的 信 
念 ， 并 不 一 定 是 最 可 靠 的 。 毕 竞 我 们 之 中 没有 任何 人 能 够 正确 应 用 贝 叶 斯 公式 ， 
即使 面 对 的 情况 极其 简单 ! 那些 在 信念 大 战 中 存活 至 今 的 信念 ， 正 是 那些 吸引 人 
数 最 多 、 让 这 些 人 能 够 存活 并 再 次 繁衍 的 信念 。 流 传 到 今天 的 信念 ， 正 是 那些 能 
够 与 最 大 型 的 人 类 文明 共存 的 信念 。 

我 被 这 种 想法 深 深 地 迷 住 了 。 虽 然 我 还 不 理解 为 什么 我 会 有 某 种 想法 ， 但 我 
算是 开始 理解 为 什么 文明 会 思考 它们 正在 思考 的 东西 了 ! 

在 这 场 亚洲 之 旅 中 ,我 接 下 来 游览 了 老挝 的 群 山 、 泰 国 兰 塔 岛 周 围 的 那些 仙 
境 般 的 小 岛 ， 还 有 马来西亚 吉隆 坡 这 座 现代 城市 。 可 惜 这 场 旅 程 最 终 迎 来 了 尾声 ， 
我 必须 回 到 加 拿 大 蒙特 利 尔 开始 攻读 博士 了 。 我 选择 与 别人 合租 ， 分 到 了 一 个 房 
间 。 有 一 个 合租 的 人 ， 我 们 叫 他 鲍 勃 吧 。 在 我 对 自身 信念 来 源 的 探寻 之 中 ， 与 鲍 
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勃 的 相遇 是 个 难以 估量 的 幸运 。 

鲍 勃 之 前 攻读 的 是 工程 学 ， 对 谓词 逻辑 很 感 兴趣 。 他 当然 也 是 个 虔诚 的 天 主 
教徒 。 但 他 尤其 喜欢 用 建设 性 的 方式 进行 冷静 的 辩论 ， 我 也 喜欢 和 他 辩论 。 我 从 
他 号 上 学 到 了 不 少 东西 。 比 如 说 ， 在 接触 到 霍金 和 蒙 治 迪 诺 的 依赖 模型 的 实在 论 
之 后 ， 我 可 以 轻松 接受 某 个 神 只 的 “现实 性 ”， 只 要 对 方 小 心地 补充 说 这 个 神 只 存 
在 于 某 个 模型 中 。 

我 在 阿 瑜 陛 耶 以 及 与 鲍 勃 相处 时 进行 的 思考 引导 我 提出 了 一 个 想法 ， 它 类 似 
于 生物 学 家 所 谓 的 “群体 选择 "。 这 个 过 程 能 够 解释 信仰 为 何 无 处 不 在 ， 尤 其 是 
过 去 的 时 代 中 。 其 中 的 论证 可 能 会 挑战 你 的 想法 ， 甚 至 令 你 震惊 。 请 注意 ， 这 只 
是 一 个 纯粹 描述 性 (或 者 预测 性 ) 的 解释 ， 而 你 在 字里行间 认为 自己 读 到 的 任何 
道德 判断 都 不 过 是 我 在 表达 上 的 失误 。 

论证 如 下 : 人 类 个 体 无 法 独自 生存 ， 即 使 是 小 部 落 也 很 有 可 能 最 终 被 更 大 的 
部 落 征 服 。 因 此 ,那些 经 过 漫长 年 代 存活 下 来 的 人 类 群体 必定 曾 在 大 型 文明 中 生 
活 过 。 然 而 ， 在 大 型 文明 中 共同 生活 是 个 艰难 的 任务 ， 这 些 大 型 文明 绝对 必须 拥 
有 适当 的 结构 才能 做 到 这 一 点 。 它 们 必须 拥有 社会 层级 ， 但 这 种 社会 层级 也 必须 
得 以 合理 化 。 这 就 是 宗教 的 作用 所 在 。 根 据 这 一 论证 ， 宗 教 是 维护 大 型 文明 的 社 
会 秩序 的 工具 之 一 ， 而 社会 秩序 对 于 人 类 的 生存 来 说 也 是 一 个 必要 条 件 。 也 就 是 
说 ， 在 历史 的 长 河中 ， 也 许 存 在 过 没有 宗教 的 人 类 群体 ， 但 他 们 也 许 没 有 把 火种 
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传承 下 来 。 
你 可 能 会 这 样 反驳: 几 个 世纪 以 来 ， 一 些 大 型 文明 也 越 来 越 不 依附 于 宗教 了 。 
但 群体 选择 同样 可 以 解释 这 一 点 。 这 是 因为 市 场 经 济 的 到 来 让 精细 分 工 得 以 实现 ， 








据 亚当 ' 斯 密 所 说 ， 这 也 让 个 体 的 个 人 主义 与 整个 社会 的 利益 取得 一 致 中。 更 妙 
的 是 ， 这 种 精细 分 工 在 没有 核心 机 构 协 调 的 时 候 获 益 更 多 ， 因 为 这 样 的 核心 机 构 
不 如 社会 成 员 自 身 更 了 解 社会 成 员 各 自 的 能 力 。 因 此 ， 在 工业 革命 之 后 ， 那 些 莲 
勃发 展 的 文明 实际 上 就 是 能 够 推翻 以 往 建立 的 社会 秩序 的 文明 D 

但 这 仍 不 足以 解释 我 的 想法 。 另 一 个 解释 就 是 环境 。 比 如 说 ， 我 就 对 鲍 勃 的 
信息 来 源 与 我 完全 不 同 这 一 点 非常 震惊 。 今 天 ， 我 读 的 基本 上 都 是 在 法 国 被 精英 
认可 的 全 国 性 有 名 刊物 。 但 正 因为 鲍 勃 的 关系 ， 我 生平 第 一 次 阅读 那些 名 字 取 自 
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《圣经 》 的 网 站 。 我 发 现 了 所 谓 的 “过 滤 气 泡 ”( filter bubble ) 问题 : 我 们 只 会 阅读 
自己 赞同 的 内 容 UU ! 

实际 上 ， 心 理学 家 所 说 的 群体 极 化 也 加 剧 了 这 种 现象 。 群 体 极 化 这 种 现象 在 
实验 室 和 法 庭 陪审 团 中 都 能 观察 到 ， 它 的 表现 大 体 如 下 : 如 果 让 认为 是 个 好 东 
西 的 某 个 群体 对 对 进行 评议 ， 在 评议 之 后 ， 这 个 群体 就 会 认为 能 够 解决 他 们 的 
所 有 问题 。 除 此 之 外 ,评议 过 程 会 使 群体 中 的 每 个 成 员 得 出 比 群体 中 任何 成 员 在 
评议 前 得 出 的 更 极端 的 结论 中 

这 个 性 状 可 能 来 自 群体 选择 ， 因 为 它 能 够 让 不 同 个 体 团 结 起 来 合作 。 但 令 人 
惊异 的 是 ， 我 们 希望 相信 所 属 群 体 相 信 的 东西 ， 这 种 现象 有 一 个 更 贝 叶 斯 的 解释 。 






































心理 作用 有 用 

















的 确 ， 纯 粹 贝 叶 斯 主义 者 会 尝试 从 群体 的 信念 中 推导 更 普 适 的 理论 ， 比 如 说 
立 该 同样 能 够 解释 其 他 群体 的 信念 。 然 而 ， 对 于 实用 贝 叶 斯 主义 者 来 说 ， 这 样 
的 模型 相当 复杂 ， 而 且 需 要 大 量 计算 ,特别 是 在 模型 的 目的 只 是 预测 某 位 信徒 会 
说 什么 之 类 的 情况 中 。 对 于 实用 贝 叶 斯 主义 者 来 说 ， 相 信和 其 他 个 体 相 信 的 东西 更 
有 用 ， 因 为 群体 中 的 共有 模型 能 更 迅速 地 预测 整个 群体 的 行为 。 这 种 想法 的 令 人 

震惊 的 结论 之 一 ， 就 是 某 个 有 神 论 团 体 的 实用 贝 叶 斯 主义 者 会 向 上 帝 的 存在 赋予 
很 高 的 置信 度 ! 当然 ， 作 为 合格 的 贝 叶 斯 主义 者 ， 他 深 知 “所 有 模型 都 是 错 的 ”， 
包括 那些 置信 和 度 很 高 的 模型 。 不 过 相信 上 帝 可 以 是 个 有 用 的 模型 。 

引入 实用 主义 会 使 贝 叶 斯 主义 者 变 得 更 主观 。 这 完全 正常 ， 因 为 某 个 人 接触 
到 的 数据 大 大 不 同 于 男 一 个 人 接触 到 的 数据 。 而 从 实用 主义 的 角度 来 说 ， 我 们 必 
须 适应 周围 的 环境 。 

而 自然 母亲 也 深 深 理解 这 一 点 。 她 选择 了 那些 性 状 适应 (或 者 能 够 适应 ) 环 
境 的 个 体 。 正 因 如 此 ， 婴 儿 对 声音 信息 的 处 理会 迅速 适应 他 们 听 到 的 语言 。 比 如 
说 ， 如 果 对 于 某 些 不 同 的 声音 ， 婴 儿 不 知道 区 分 它们 会 对 预测 能 力 有 什么 帮助 的 
话 ， 他 们 就 会 将 这 些 不 同 的 声音 混为一谈 。 这 种 学 习 过 程 让 婴儿 对 信号 的 处 理 更 
实用 ， 即 使 这 会 带 来 一 个 讨厌 的 后 果 : 一 旦 成 人 ,我们 就 不 再 能 够 区 分 一 门 外 语 
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中 某 些 有 区 别 的 音素 。 
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我 们 对 身边 环境 的 适应 也 解释 了 我 们 在 数据 科学 家 所 谓 的 “ 单 样本 学 习 ” 
C one-shot learning ) 中 的 惊人 能 力 。 这 种 学 习 就 是 从 单一 数据 中 推断 出 大 量 信息 的 


过 程 ， 比 如 说 在 只 看 过 一 张 


























“tufa” 的 照片 的 情况 下 就 能 将 它 认 出 来 。 实 际 上 ， 我 





们 已 经 在 第 19 章 中 看 到 婴儿 能 做 到 更 厉害 的 事情 ， 因 为 在 某 些 情 境 下 ， 婴 儿 甚至 


能 够 在 没有 数据 的 情况 下 学 习 ! 为 了 完成 这 一 壮举 ， 婴 儿 必 须 拥 有 某 种 非常 完整 
而 且 结 构 完 善 的 偏见 ， 才 能 让 贝 叶 斯 推断 大 大 改变 认 知 的 状态 。 

人 类 在 单 样本 学 习 中 的 成 功 也 揭示 了 一 个 经 常 被 那些 个 体 平等 的 代 辩 者 否定 
的 方面 ， 就 是 我 们 生来 就 有 一 个 包含 着 偏见 的 大 脑 。 仔 细 思 考 一 下 ， 这 并 没有 什 
么 惊人 之 处 。 我 们 的 大 脑 有 着 非常 特殊 的 结构 ， 包 括 两 个 半球 、 下 丘脑 和 前 额 皮 
质 。 这 就 是 自然 选择 保留 下 来 的 结构 。 所 以 ， 与 主流 的 意见 相反 ， 大 脑 并 不 是 一 
面 可 以 任意 涂写 的 白板 (在 英语 中 是 blank slate )。 我 们 生来 就 有 偏见 ， 它 让 我 们 
准备 好 面 对 周 围 的 环境 ， 在 这 些 偏 见 中 ， 尤 其 重要 的 是 预先 存在 的 信号 处 理 机 制 ， 
它 处 理 的 是 耳 人 条、 眼睛 和 鼻子 发 送 到 大 脑 的 信号 。 

这 个 不 符合 实际 的 白板 假说 还 有 一 个 变 体 ， 它 假设 我 们 在 出 生 时 大 脑 完 全 相 
同 ， 因 此 我 们 在 学 习 能 力 上 生 而 平等 。 这 也 不 符合 实际 情况 。 对 双胞胎 的 研究 表 
明 ， 基 因 会 让 我 们 倾向 于 持 有 特定 的 政治 信念 。 的 确 ， 出 生 后 被 分 开 抚 养 的 同 卵 
双胞胎 通常 比 收养 而 来 的 兄弟 姐妹 更 倾向 于 拥有 相同 的 政治 意见 。 

然而 ， 实 用 主义 式 的 习惯 性 思维 与 基因 层面 上 的 倾向 让 我 们 准备 好 面 对 某 种 
情景 ， 这 个 事实 也 说 明 ， 我 们 的 大 脑 不 一 定 替 我 们 做 好 了 跳出 这 一 情景 的 准备 。 
我 们 也 许 能 很 好 地 做 出 与 日 常生 活 相 关 的 预测 ， 但 这 并 不 代表 那些 赢得 我 们 置信 
度 的 模型 在 日 常生 活 以 外 有 任何 用 处 。 如 果 说 短暂 的 军旅 生涯 、 亚 洲 之 旅 以 及 与 
鲍 勃 相识 教会 了 我 什么 的 话 ， 那 就 是 在 解释 并 理解 于 我 而 言 非 常 陌生 的 宇宙 时 ， 















































我 的 模型 何等 脆弱 。 我 理解 到 ， 我 自己 所 用 的 模型 在 我 心中 赢得 的 置信 度 ， 其 适 















































































































































用 范围 比 我 预想 的 要 狭窄 得 多 。 


我 理解 到 自己 曾 活 在 自 








言 过度 之 中 ,我 也 理解 了 其 中 的 多 个 原因 。 我 受到 了 


教育 与 同伴 的 片面 影响 ， 继 承 了 祖先 的 基因 与 文化 ， 承 受 着 不 可 胜 数 的 认 知 偏差 ， 
活 在 自己 的 小 小 气泡 之 中 ， 其 中 的 性 质 与 气泡 之 外 的 性 质 相 去 甚 远 。 























344 | “ 贝 叶 斯 的 博弈 : 数学 、 思 维 与 人 工 智能 





视频 网 站 的 魔法 


那 时 ， 即 使 经 历 过 如 此 波折 ， 我 还 没 意 识 到 自己 自信 过 度 的 严重 程度 。 但 我 
很 好 奇 ， 希 望 探究 这 一 点 ， 这 在 我 人 生 中 还 是 头 一 次 。 幸 运 的 是 ， 正 是 这 个 时 候 
我 发 现 了 YouTube. 

在 接 下 来 的 几 年 中 ,我 逐渐 沉迷 于 在 网 上 输出 大 量 知识 普及 内 容 的 先驱 者 。 
全 靠 他 们 以 及 其 他 知识 普及 者 ， 我 才 接 触 到 新 可 乐 的 故事 、 阿 施 从 众 实验 、 米 尔 
格 兰 姆 服从 性 实验 、 津 巴 多 的 斯 坦 福 监 狱 实验 、 安 奈 剂 与 反 安 奈 剂 效应 ， 以 及 利 
贝 和 海 恩 斯 有 关 自 由 意志 的 实验 。 我 自己 也 开 了 个 博客 ， 写 了 一 篇 博文 来 讲述 这 
些 实验 中 。 正 是 在 这 篇 博文 的 撰写 过 程 中 ， 我 才 真 正 从 内 心 最 深 处 感受 到 这 些 实 
验 说 明了 人 类 什么 样 的 普遍 特质 ， 当 然 对 我 这 个 个 体 来 说 同样 适用 。 

我 在 网 络 上 “ 狂 刷 ”公开 发 布 的 纪录 片 和 讲座 (有 了 时， 其 中 一 些 有 版 权 问 
题 )。 这 改变 了 我 的 生活 ， 以 及 我 看 待 世 界 的 方式 。 在 2016 年 2 月 7 日 召开 于 里 
昂 科学 大 会 ( Lyon Science) 的 一 场 讲座 中 ， 达 维 德 ， 卢 阿 普尔 甚至 主张 “视频 网 
站 是 文字 发 明 以 来 最 不 可 思议 的 东西 "。 他 的 解释 是 “演化 让 人 类 长 于 通过 口语 交 
流 ”"。 但 一 般 来 说 ， 两 个 人 之 间 的 口头 交流 ， 需 要 他 们 都 在 同一 时 间 处 于 同一 地 
点 。 普 遍 意义 上 的 视频 网 站 让 口语 能 突破 时 空 的 界限 ， 无 论 是 现在 还 是 未 来 ， 只 
要 有 人 希望 倾听 ， 它 让 今天 的 所 有 人 都 能 向 世界 上 数 以 百 万 计 的 其 他 人 讲述 某 件 
事情 。 达 维 德 ， 卢 阿 普尔 的 讲座 结束 后 ， 过 了 三 天 ， 我 就 设立 了 自己 的 (法 语 ) 
频道 Science4All。 这 是 一 场 大 冒险 的 起 点 。 

这 也 正 是 科普 的 美妙 之 处 ， 科 普 总 是 让 人 想 知 道 得 更 多 。 我 非常 感 兴趣 ， 阅 
读 了 所 有 这 些 伟大 的 研究 者 的 著作 。 我 发 现 了 一 个 全 新 的 宇宙 ， 其 中 探寻 了 我 们 
为 什么 会 有 某 种 念头 ， 以 及 怎样 才能 更 好 地 思考 我 们 心中 的 想法 。 我 学 到 了 很 多 ， 
但 尤其 重要 的 是 ， 我 对 自身 无 知 的 广度 把 握 得 越 来 越 准确 D, 



































































































































旅途 仍 在 继续 


但 这 些 形形色色 的 知识 缺少 整体 结构 。 庞 加 莱 曾 这 样 说 过 :“ 事 实 的 堆砌 与 一 
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门 科学 的 距离 并 不 比 一 堆 石 头 与 一 座 房屋 的 距离 近 。” 我 开始 寻求 一 个 关于 理论 的 


理论 ， 某 种 能 够 让 我 将 
长 一 段 时 间 中 ， 我 并 没 


管 案 束 在 一 个 术语 “ 贝 1 














形 色 色 的 知识 结合 起 来 并 得 到 更 好 的 理解 的 东西 。 在 很 
意识 到 答案 就 在 一 个 公式 之 中 ， 尽 管 我 一 直 都 在 研究 它 ; 





























上 斯 ”之 中 ， 这 个 词 在 我 自己 的 博士 论文 题目 的 开头 就 出 


JU D U3, 2016 EH, 我 逐渐 意识 到 这 个 公式 的 重要 性 。 在 “ 骑 驴 找 驴 ”了 很 长 时 
间 之 后 ， 我 终于 走 上 了 贝 叶 斯 主义 的 道路 。 

这 并 不 是 短暂 的 闲逛 ， 而 是 悠长 的 旅程 ， 两 年 之 后 ， 我 感觉 自己 才 只 走 了 最 
初 几 步 。 最 大 的 困难 之 一 就 是 从 自己 温 淫 多 年 的 “科学 ”领域 抽身 。 我 必须 抛弃 
万 值 方法 、 对 于 可 证 伪 性 的 要 求 ， 以 及 对 于 达到 客观 性 的 期 望 。 我 必须 首先 据 弃 
“科学 方法 ”， 但 出 于 动机 性 思考 、 认 知 失 调和 群体 极 化 ， 绝 大 部 分 科学 研究 者 在 
捍卫 这 个 方法 。 我 必须 反对 自己 仰 葡 的 那些 人 的 意见 。 

但 这 还 不 是 最 大 的 困难 。 最 大 的 障碍 今 时 今日 还 横 吾 在 我 面前 ， 那 就 是 如 何 




















真正 地 理解 贝 叶 斯 主义 
能 









































， 计 算出 它 导出 的 结论 并 获取 (近似 地 ) 应 用 这 种 方法 的 








力 。 在 本 书 中 ,我 尽力 帮助 你 做 到 这 一 点 ,但 我 自身 的 认 知 局 限 实在 大 大。 萨 


$ 


à. 











1 克拉克、 蒙 带 ， 堆 尔 问题 以 及 苏格兰 黑色 绵羊 等 例子 一 遍 又 一 遍地 证 明了 这 





一 点 。 我 仍然 无 法 正确 地 应 用 贝 叶 斯 公式 ， 哪 怕 是 极度 简化 的 近似 版 本 。 


我 要 走 的 路 还 很 长 


， 但 我 现在 更 好 地 理解 了 我 不 知道 什么 ， 还 有 我 为 什么 不 








知道 。 我 知道 我 缺乏 正确 估算 出 那 位 “钓鱼 ”学 生 的 问题 的 正确 答案 的 能 力 ， 而 
这 种 缺乏 会 让 我 无 法 可 靠 地 计算 出 应 该 对 我 大 脑 中 各 种 不 同 的 模型 赋予 多 少 置信 
度 。 而 我 知道 我 的 大 脑 有 很 大 的 局 限 性 ， 无 法 容纳 所 罗 门 诺 夫 复杂 度 或 者 本 内 特 
逻辑 深度 那 过 于 巨大 的 模型 。 

正 是 这 些 因 素 迫 使 我 必须 更 好 地 理解 自身 的 无 知 延伸 到 了 什么 地 方 。 而 我 也 





















































希望 ， 在 未 来 能 够 尽量 避免 自己 的 自信 过 度 。 








BEA Re An 8 JC GS X SLE S 
弗 朗 索 瓦 ， 拉 伯 雷 (1483 或 1494—1553 ) 
要 严密 地 理解 伦理 ， 必 须 先 理解 数学 。 

苏 格 拉 底 ( 公元 前 469 一 公元 前 399 ) 
解决 这 个 问题 ( 在 人 工 智 能 中 编 入 道德 ) 是 
一 个 值得 投入 下 一 代 最 伟大 的 数学 人 才 去 解 
决 的 研究 挑战 。 

尼克 … 博 斯 特 罗 姆 (1973 一 ) 


第 之 之 章 


超越 贝 叶 斯 主义 


贝 叶 斯 不 考虑 道德 哲学 





弗 里 德里 希 ' 尼采 上 断言 :“ 上 帝 已 死 。 尼采 不 认同 基督 教 ， 尽 管 如 此 ， 他 这 句 
关于 上 帝 的 话 丝毫 不 是 什么 庆祝 ， 也 不 是 洋 详 得 意 。 对 于 尼采 来 说 ， 上 和 帝 之 死 首 
先是 一 个 不 安 的 源泉 ， 因 为 尼采 看 到 了 信仰 给 社会 带 来 众多 好 处 。 

我 们 之 前 看 到 ， 对 于 贝 叶 斯 主义 者 来 说 ， 一 切 都 是 虚构 。 由 此 立刻 能 够 得 到 
的 推论 就 是 所 有 道德 原则 也 是 虚构 。 毕 竟 ， 看 看 我 们 在 定义 生命 的 时 候 遇 到 的 困 
扰 ， 我 们 真 的 能 够 给 出 “不 可 杀人 ”这 条 诫 命 的 确切 定义 吗 ? 这 名 话 包含 了 生活 
在 我 们 体内 的 数 十 亿 个 细菌 吗 ? 如果 这 句 话 只 能 指 代 人 类 的 话 ， 我 们 又 是 否 确 定 
自己 能 够 将 人 与 非 人 区 分 开 来 ?胚胎 从 什么 时 候 开 始 算 是 人 类 ?如 果 必 须 杀 掉 某 个 人 
才能 抒 救 其 他 数 千 个 人 怎么 办 ? 是 不 是 应 该 在 希特勒 掌握 权力 之 前 杀 掉 他 ? 

虽然 贝 叶 斯 主义 者 否定 某 种 基本 道德 原则 的 存在 ， 但 他 对 于 应 该 遵行 的 正确 

道德 准则 并 没有 什么 说 法 。 这 相当 于 某 种 规范 伦理 哲学 ， 也 就 是 某 种 讨论 应 然 的 







































































哲学 。 然 而 ， 贝 叶 


利 


好 ， 














斯 











用 某 种 方法 将 知识 组 











什么 是 坏 ， 


主义 并 不 是 一 种 规范 
日 织 起 来 。 但 这 并 没有 给 出 任何 道德 上 的 教训 : 
应 该 做 什么 ， 


主义 者 都 不 考虑 道德 哲学 ， 


他 们 也 绝 不 会 尝试 说 服 你 
义 者 只 是 一 台 
但 这 不 是 说 道德 在 贝 叶 
会 以 人 类 上 


修 ， 














应 用 贝 叶 


甚至 连作 为 贝 叶 
让 你 相信 自 
斯 公式 〈 的 各 种 近似 版 本 ) 的 机 器 。 


道德 哲 





应 该 禁止 什么 ? 

















自己 应 
































而 且 同 一 社会 群 


新 分 配 ， 贝 叶 


斯 主义 者 的 语言 中 没有 一 
方式 行动 ， 比 如 在 餐馆 
社会 生产 的 财富 进行 重 
拥有 自己 的 道德 观 ， 


留 下 小 费 ， 























自然 ( 选择 得 到 的 ) 道德 


个 人 独自 忽略 所 有 道德 感 


这 个 问题 变 得 尤其 已 


主义 者 得 到 好 处 ， 


长 期 以 来 ， 亲属 选 择 假说 独占 主流 。 这 一 假说 将 
而 生物 个 体 只 是 基因 用 以 更 好 地 复制 自身 的 工 
体 最 大 化 基因 相似 的 后 代 的 个 数 。 这 档 
后 代 对 它 有 好 处 ， 因 为 蜂 后 的 后 代 必 然 拥 有 与 这 只 蜜蜂 相似 的 基因 。 
但 这 一 假说 似乎 有 其 局 限 性 ， 
此 有 人 提出 了 其 他 假说 。 在 其 中 
这 是 因为 在 狩猎 采集 者 的 时 代 ， 
合作 网 络 以 外 ， 
性 。 


下 大 量 








从 表面 来 看 ， 甚 至 




















人 类 社会 存在 道德 这 一 点 
， 利 用 其 他 人 的 利他 主义 却 不 做 出 任何 回报 的 话 ， 岂 不 
会 有 所 得 益 ? 再 加 上 自然 选择 倾向 于 那些 行为 能 
迷人 。 理 论 上 说 ， 这 种 自然 选择 似乎 应 该 让 那些 不 道德 的 利 已 


德 哲 学 。 


斯 主义 者 是 否 正 确 或 者 合 
该 更 多 地 


如 而 完 
斯 主义 者 会 发 现 一 
体 中 的 每 个 个 体 通 常 都 有 相似 的 道德 观 。 
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贝 叶 斯 主义 者 所 做 的 ， 就 是 

到 底 什么 是 
斯 主义 者 和 实用 贝 叶 斯 
适 都 不 考虑 。 


依赖 贝 叶 斯 公式 ! 贝 叶 斯 主 


























纯粹 贝 叶 



































席 之 地 。 要 解释 为 什么 人 类 
毕 后 冲洗 马桶 ， 还 有 对 整个 
个 有 用 的 假设 : 每 个 人 都 





就 有 某 种 惊人 之 处 。 如 果 任 何 一 


使 繁衍 后 代数 目 最 多 的 个 体 ， 











然而 ， 有 几 种 办 法 可 以 解释 自然 界 中 的 利 

















而 承担 代价 的 就 是 伦理 观 无 可 挑剔 的 利他 主义 智者 。 
也 主义 行为 是 如 何 出 现 并 延续 的 。 





基因 作为 自然 选择 所 作用 的 对 象 ， 





























这 就 会 迫使 这 个 个 体 独自 在 自 














NO 因此 ， 


基因 会 让 所 属 的 生物 个 





FE 的话 ， 对 于 蜜蜂 来 说 ， 

















牺牲 自己 让 蜂 后 产 














E 


尤其 是 在 尝试 将 它 应 用 到 人 类 身上 的 时 候 。 因 
个 假说 里 ， 同 伴 选择 这 个 概念 正 是 道德 的 关键 。 
某 个 不 符合 道德 的 个 体 很 有 可 能 会 被 迅速 排除 到 
然 中 生活 ， 被 剥夺 任何 生存 的 可 能 


简单 的 模拟 表明 ， 这 个 假说 也 许 足 以 解释 利他 主义 趾 。 
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人 们 提出 的 另 一 个 假说 就 是 群体 选择 。 在 这 里 ， 道 德 的 关键 同样 是 它 使 不 同 
个 体 得 以 合作 的 能 力 。 这 是 因为 ， 某 个 群体 要 拥有 更 大 的 生存 机 会 的 话 ， 群 体 人 
口 就 必须 增加 ， 而 且 即 使 如 此 ， 每 个 个 体 仍 能 继续 合作 。 和 群体 假说 假设 大 部 分 群 
本 无 法 做 到 这 一 点 ， 原 因 是 它们 的 道德 准则 不 足以 维持 庞大 社会 中 的 生活 。 存 活 
下 来 的 群体 必然 就 是 那些 由 道德 感 相 当 发 达 的 个 体 组 成 的 群体 ， 这 使 得 在 社会 
群体 能 够 优先 于 个 体 。 

群体 选择 预言 了 道德 的 一 个 重要 侧面 ， 世 界 各 地 都 能 找到 它 的 例证 ， 那 就 是 
对 异己 与 叛徒 的 排斥 。 这 是 因为 ， 如 果 某 个 群体 想 要 存活 下 来 ,不仅 其 中 的 个 体 
要 拥有 强健 而 适当 的 道德 原则 ， 而 且 群 体 也 必须 能 够 抵抗 利己 主义 个 体 的 渗透 。 
为 此 ， 群 体 必 须 有 办 法 发 现 这 种 利己 主义 个 体 并 将 其 驱逐 ， 就 像 我 们 的 免疫 系统 
对 付 癌 细 胞 一 样 。 反 过 来 说 ， 群 体 也 必须 青 定 其 中 的 个 体 ， 利 用 某 些 被 个 体 神圣 
化 的 符号 将 他 们 团结 起 来 ， 这 些 符 号 可 以 是 语言 、 旗 帜 或 者 赞歌 。 群 体 选择 因此 
预言 ， 我 们 会 对 自身 认同 的 群体 持 有 某 种 狂热 外。 这 又 是 一 个 在 各 种 社会 中 都 能 
找到 的 行为 。 

此 外 ,尼采 指出 贵族 的 狂热 与 平民 的 狂热 让 各 自 的 追随 者 对 于 “好 ”的 反 义 

词 有 着 各 自 不 同 的 理解 。 对 前 者 而 言 ,，“ 好 ”的 反面 就 是 “ 差 " 申 ; 对 后 者 来 说 ， 
好 的 反面 就 是 “ 坏 ” 外 。 哲 学 家 带 博 . 吉 罗 是 这 样 解释 的 : “ 差 ” 就 是 那些 希望 变 
好 但 做 不 到 的 ， 而 “ 坏 ” 就 是 那些 可 以 变 好 但 不 希望 这 样 做 的 。 
但 这 个 有 关 道 德 来 自 群 体 认 同 的 例子 不 过 是 众多 例子 之 一 。 人 们 可 以 认同 其 
他 狂热 潮流 ， 无 论 是 自由 意志 主义 、 平 等 主义 、 传 统 主义 、 民 族 主义 还 是 全 球 主义 。 
在 所 有 这 些 情况 中 ， 相 关 和 群体 中 的 每 个 个 体 似乎 会 首先 对 所 在 群体 产生 认同 ， 然 
后 为 了 辩护 所 在 群体 的 理念 而 届 从 于 非 理 性 马 ， 接 下 来 尝试 合理 化 自身 的 立场 四 

我 甚至 要 指责 科学 工作 者 与 科学 爱好 者 ， 他 们 创造 了 某 种 对 科学 的 狂热 ， 倾 
向 于 以 不 理性 的 方式 维护 科学 的 合理 性 。 这 种 科学 狂热 就 此 解释 了 对 客观 性 的 苛 
求 ， 即 使 客观 性 只 是 错觉 ， 它 还 解释 了 对 “科学 方法 ”的 接受 ， 即 使 纯粹 贝 叶 斯 
主义 者 和 实用 贝 叶 斯 主义 者 都 断言 ， 对 于 科学 的 运作 方式 来 说 ， 这 既 不 是 一 个 良 
好 的 描述 性 理论 ， 也 不 是 一 个 合适 的 规范 性 理论 M, 

我 希望 ， 你 作为 一 个 合格 的 贝 叶 斯 主义 者 ， 不 会 去 尝试 断定 这 三 个 解释 了 道 
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德 来 源 的 假说 之 中 哪 一 个 是 正确 的 。“ 所 有 模型 都 是 错 的 "。 而 不 同 的 模型 可 以 用 























在 不 同 的 场合 。 亲 属 选择 假说 可 以 用 于 理解 家 庭 的 重要 性 ， 同 伴 选 择 假说 可 以 用 
于 理解 我 们 对 家 长 里 短 的 嗜好 ， 而 群体 选择 假说 可 以 用 于 理解 群体 极 化 现象 。 在 

















所 有 这 些 例子 之 中 ， 令 人 印象 深刻 的 是 我 们 可 以 从 演化 原则 出 发 ， 推 


会 的 道德 。 今 天 人 类 个 体 拥有 的 道德 并 非 不 可 思议 ， 也 不 神秘 莫 测 ， 
乎 不 值得 占据 比 拥 有 这 些 道德 的 个 体 更 基础 的 地 位 。 
但 你 也 知道 ,“ 所 有 模型 都 是 错 的 "， 其 中 也 包括 那些 道德 哲学 。 



































实际 上 ， 许 多 心理 学 实验 反复 指出 我 们 的 道德 直觉 有 着 大 量 缺 陷 ， 








导出 人 类 社 
因此 道德 似 


首先 就 在 于 


我 们 对 自身 偏好 以 及 这 些 偏好 的 来 源 所 知 其 少 。 许 多 实验 表明 ， 我 们 会 根据 红酒 
的 售 价 来 评判 红酒 本 身 ， 就 好 像 味蕾 能 够 分 清 以 不 同 价格 销售 的 同一 种 红酒 一 样 。 

最 具 戏 剧 性 的 例子 可 能 就 是 新 可 口 可 乐 的 故事 。 在 20 世纪 80 年 代 ， 美 国 的 
可 乐 市 场 被 可 口 可 乐 和 百事 可 乐 两 个 品牌 瓜分 。 育 测 实验 表明 人 们 更 喜欢 百事 可 
乐 ， 而 不 是 可 口 可 乐 。 可 口 可 乐 对 此 的 反应 就 是 改变 配方 ， 将 所 谓 的 “新 可 口 可 










































































乐 ” 推 向 市 场 。 在 新 的 盲 测 实验 中 ， 人 们 更 喜欢 这 种 新 可 口 可 乐 ， 而 不 是 百事 可 





乐 ， 更 不 要 说 原来 配方 的 可 口 可 乐 了 。 








然而 人 们 在 真正 品尝 新 可 口 可 乐 的 时 候 并 没有 蒙 上 眼睛 ! 无 论 出 于 什么 心理 上 








的 原因 ， 美 国人 群情 激昂 ， 开 始 反 对 可 口 可 乐 的 这 项 创新 ， 要 求 重 








ung 














新 使 用 原来 的 


配方 。 可 口 可 乐 最 终 顺 应 了 大 众 的 要 求 。 新 可 口 可 乐 被 取消 ， 而 诛 有 配方 的 可 乐 








重新 被 推 向 市 场 。 更 奇怪 的 是 ， 可 口 可 乐 销售 激增 ， 获 得 了 前 所 未 有 的 知名 度 四 











可 口 可 乐 成 功 的 幕后 功臣 其 实 就 是 广告 业 。 这 项 产业 可 能 在 无 意 


之 中 利用 了 


一 项 名 为 “纯粹 曝光 效应 ”的 认 知 偏差 。 由 美国 华盛顿 州 的 两 所 大 学 进行 的 一 项 








实验 就 完美 地 展示 了 这 个 现象 。 研 究 者 在 大 学 报纸 上 刊登 了 一 些 广告 ， 








其 中 包含 


一 些 生 造 的 单词 ， 比 如 “kardiga”“saricik” 和 “nansoma”。 关 键 在 于 ， 这 些 单 词 
在 其 中 一 所 大 学 的 报纸 中 出 现 的 频率 要 远 远 超过 男 一 所 大 学 的 报纸 。 然 后 ， 这 些 




















研究 者 让 学 生 给 这 些 单词 的 窒 贬 程度 打分 ， 得 到 的 结果 非常 一 致 : 


常 出 现 的 单 
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词 对 学 生来 说 春 义 程度 最 高 。 我 们 喜欢 那些 熟悉 的 东西 。 

根据 心理 学 家 卡 内 曼 的 说 法 ， 这 个 实验 可 以 用 所 谓 的 认 知 流畅 度 来 解释 。 这 
个 想法 就 是 ， 由 于 大 脑 厌 恶 思 考 ， 因 此 它 喜 欢 那些 容易 想到 的 东西 。 这 就 是 为 什 
么 名 字 容 易 发 音 的 律师 能 接手 更 多 客户 ， 股 市 中 那些 缩写 能 够 直接 读 出 来 的 公司 ， 
股价 比 其 他 公司 更 高 。 然 而 这 种 对 认 知 流畅 度 的 偏好 可 能 会 影响 解决 某 些 问 题 时 
所 需 的 脑力 劳动 过 程 。 另 一 个 惊人 的 实验 表明 ， 在 面 对 一 张 充满 陷阱 的 试卷 时 ， 
如 果 试 卷 印刷 所 用 的 字体 更 难以 阅读 的 话 ， 学 生 的 表现 就 会 好 得 多 。 根 据 卡 内 曼 
的 说 法 ， 如 果 字 体 太 容易 阅读 ， 学 生 就 会 被 认 知 流畅 度 蒙蔽 ， 不 会 花 足 够 的 时 间 
来 思考 四。 

虽然 这 些小 小 的 偏差 会 妨碍 我 们 每 个 人 ,但 它们 似乎 并 不 是 什么 道德 问题 。 
此 言 差 笑 。 大 量 研 究 显示 ， 人 们 在 看 到 候选 人 的 脸 之 后 的 100 毫秒 内 就 很 大 程度 
上 决定 了 他 们 会 怎么 投票 "0。100 点 秒 就 是 瞬 个 眼 的 工夫 ! 所 以 , 我们 在 只 看 到 
候选 人 的 脸 之 后 的 100 毫秒 内 对 候选 人 能 力 的 判断 ， 很 大 程度 上 决定 了 我 们 对 这 
位 候选 人 及 其 性 格 与 领导 能 力 的 看 法 。 

当然 ， 当 有 人 问 起 我 们 ， 让 我 们 解释 自己 的 政治 信念 时 ， 我 们 肯定 不 会 提起 
这 个 解释 ! 我 们 几乎 从 来 不 知道 自身 信念 真正 的 来 源 ， 却 一 直 尝 试 解释 这 些 信念 。 
就 像 乔纳森 ' 海 特 所 说 的 :“ 直 觉 先 行 ， 然 后 说 理 。” 海 特 认为 ,我们 的 理性 花 时 间 
列 出 大 量 为 了 解释 直觉 所 选择 的 立场 而 特意 构筑 的 论证 ， 以 及 和 否定 所 有 可 能 动摇 
这 一 立场 的 论证 。 
直觉 决定 理性 思考 最 戏剧 化 的 例子 之 一 就 是 丹 ' 卡 享 进行 的 一 项 实验 。2013 
年 ， 卡 享 让 学 生 完 成 一 道 经 典 数 学 习题 : 利用 交叉 相 乘法 确定 某 种 护肤 霜 的 效果 。 
学 生 的 正确 率 不 怎么 高 ， 但 还 算 合理 。 然 后 卡 享 修改 了 习题 的 表述 ， 现 在 需要 确 
定 的 是 某 项 法 律 对 于 减少 枪械 携带 的 有 效 性 ， 但 数字 与 之 前 完全 相同 。 所 以 习题 
的 解答 过 程 并 没有 改变 ， 习 题 的 难度 也 完全 相同 。 尽 管 如 此 ， 学 生 的 解答 却 变 得 
糟糕 透 项 。 更 不 妙 的 是 ,无论 习题 本 身 应 该 得 出 什么 结论 ， 做 题 的 学 生 总 是 会 得 
出 符合 自身 信念 的 结论 。 他 们 的 直觉 已 经 选 好 了 立场 ， 所 以 理智 必须 服从 01, 

如 果 说 卡 享 这 个 例子 非常 明显 ， 那 么 在 那些 激昂 的 论述 中 ,词语 的 选择 也 必 
然 会 影响 朗读 或 者 倾听 这 些 论述 的 人 的 直觉 ， 让 直觉 和 道德 价值 倾向 于 某 个 阵营 ， 
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而 不 是 其 他 阵营 。 因 此 ， 词 语 的 感情 色彩 通常 会 在 我 们 察觉 不 到 的 情况 下 ， 微 妙 
地 对 直觉 持 有 的 立场 产生 巨大 的 影响 ， 从 而 改变 我 们 支持 或 者 为 其 辩护 的 论点 。 
惊人 的 是 ， 要 将 褒贬 程度 不 同 但 含义 相同 的 词语 联系 起 来 ， 对 我 们 来 说 无 比 困难 。 

我 是 在 几 年 前 才 意 识 到 这 种 现象 的 ， 这 让 我 在 面 对 感 情色 彩 强 烈 的 词语 时 ， 
会 去 寻找 与 它 感情 色彩 完全 相反 的 同义词 。 要 找到 这 样 完美 的 同义词 通常 相当 困 
难 ， 但 要 确定 我 的 直觉 为 什么 采取 了 某 种 立场 ， 即 使 不 完美 的 同义词 对 我 来 说 也 
非常 有 用 ， 只 要 二 者 感情 色彩 相反 就 可 以 了 。 我 在 这 里 也 请 你 思考 一 下 这 几 对 词 
语 : 民主 与 民粹 、 慌 怖 主义 与 反抗 力量 、 社 区 与 宗派 、 暴 君 与 领导 人 、 天 然 与 野 
性 、 灌 输 与 教育 ， 国 内 生产 总 值 与 债务 流动 、 虚 伪 与 外 交 秤 令 、 谨 慎 与 骗子 、 偶 
见 与 贝 叶 斯 先 验 …… 我 尤其 要 请 你 继续 扩展 这 个 列表 ， 然 后 在 每 次 听 到 激动 人 心 
的 论调 时 都 以 此 为 鉴 一 一 尤其 是 在 你 自己 的 言辞 之 中 中。 更 进一步 ， 正 如 我 在 这 
本 书 中 用 到 “偏见 ”这 个 词 一 样 ， 我 也 建议 你 在 维护 自己 立场 时 ， 在 论述 中 采用 
贬义 词 。 当 然 ， 这 样 做 的 话 你 会 更 难说 服 别 人 。 所 以 ， 如 果 你 觉得 辩论 的 目标 就 
是 赢得 辩论 或 者 增加 威望 的 话 ， 那 这 显然 就 是 个 糟糕 的 策略 ; 但 如 果 你 的 首要 目 
的 是 让 想法 ( 也 包括 你 自己 的 想法 ) 更 清晰 ， 并 对 不 同 理论 的 置信 和 度 进行 贝 叶 斯 
计算 的 话 ， 那 么 利用 与 自身 立场 相反 的 感情 色彩 就 非常 有 有用。 效果 之 一 就 是 让 你 
不 至 于 用 错误 的 论证 来 说 服 别人 ( 其 至 是 自己 )。 费 曼 是 这 样 说 的 :“ 第 一 个 原则 就 
是 不 要 骗 自己 一 一 你 自己 就 是 最 好 骗 的 那个 人 。” 因 此 ， 如 果 你 要 为 消费 天 然 产 品 
辩护 的 话 ， 可 以 先 尝试 证 明 这 些 野性 产品 在 什么 方面 更 优秀 。 

不 笠 的 是 ,决定 我 们 的 道德 信念 的 不 仅 是 词语 的 赛 贬 。 正 如 我 们 在 第 17 章 中 
谈 到 过 的 那样 ， 我 们 的 直觉 是 由 身边 的 环境 引导 形成 的 。 这 就 是 启动 效应 。 我 们 的 
道德 依赖 于 某 些 通常 不 被 察觉 的 刺激 ”, 正如 事 尔 斯 和 佩带 的 实验 证 明 ,， 简单 的 头 部 
动作 会 在 无 意识 中 引导 我 们 对 学 费 金额 给 出 不 同 的 道德 评判 。 同 样 ， 一 些 研究 表明 ， 
投票 点 设立 在 学 校 中 的 这 个 简单 事实 也 会 明显 改变 投票 者 对 教育 的 重视 程度 。 






































































































































































































































CD 启动 效应 在 认 知 方面 已 被 实验 所 确立 ， 但 在 社交 情景 方面 仍 有 和 争议， 道德 也 在 其 中 。 某 些 关 
于 社交 情景 的 启动 效应 实验 无 法 被 重复 ， 而 男 一 些 实验 则 是 效用 不 足 。 此 外 ， 在 社交 情景 
面 ， 启 动 效 应 能 否 长 期 存在 仍 有 争议。 简单 而 言 ， 就 目前 的 实验 状况 来 说 ， 局 动 效 应 对 个 人 
的 道德 选择 应 该 有 一 定 的 影响 ， 但 由 于 存在 众多 其 他 因素 的 影响 ， 启 动 效应 在 社交 情景 ( 包 

括 道德 ) 方面 的 具体 效力 、 延 续 时 长 、 有 效 场 景 仍 有 待 研究 。 译 者 注 
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胡萝卜 加 大 棒 

















然而 ， 没 有 意识 到 自身 的 道德 直觉 只 是 问题 的 一 部 分 ! 道德 的 演化 解释 的 另 
一 个 推论 ， 就 是 我 们 的 道德 直觉 适应 于 史前 时 代 。 更 糟糕 的 是 ， 这 种 直觉 只 有 在 
基因 存活 的 角度 来 看 才 是 好 的 。 所 以 ， 我 们 可 以 大 大 怀疑 这 种 直觉 在 现代 社会 中 
是 否 适 用 。 此 外 ， 近 几 个 世纪 以 来 ， 尤 其 是 在 工业 革命 之 后 ， 道 德 发 生 了 巨大 的 
演变 。 

虽然 纯粹 贝 叶 斯 主义 者 和 实用 贝 叶 斯 主义 者 对 于 未 来 社会 的 道德 有 着 自己 的 
预测 〈 可 能 包含 很 大 的 不 确定 性 )， 但 不 笠 的 是 ,我 的 认 知 能 力 恐 介 过 于 有 限 ， 无 
法 对 我 们 后 代 的 道德 本 性 做 出 可 靠 的 预测 。 尽 管 如 此 ， 我 心中 的 贝 叶 斯 主义 者 愿 
意 打 赌 ,我 们 的 道德 在 之 后 几 十 年 中 仍然 会 被 不 断 颠 履 ， 而 且 这 种 颠覆 的 节奏 可 
能 在 人 类 历史 上 绝无仅有 ， 甚 至 会 达到 我 们 的 后 代 可 能 会 认为 今天 的 道德 完全 落 
后 、 非 理性 、 甚 至 不 道德 的 程度 。 

这 种 预测 的 理由 之 一 在 于 ， 我 们 的 道德 就 是 以 这 种 方式 形成 的 。 虽然 道德 的 
确 有 一 部 分 由 我 们 的 遗传 基因 决定 ,但 也 有 很 大 一 部 分 由 后 天 学 习 而 来 ， 无 论 来 
源 是 学 校 还 是 父母 ， 其 形成 方法 就 是 “ 胡 蓝 下 加 大 棒 ”。 机 带 学 习 领 域 的 研究 者 为 
了 培育 人 工 知 能， 在 让 它 能 完成 指定 的 功能 时 用 的 也 是 这 种 “ 胡 葛 下 加 大 棒 ” 的 
方法 。 如 果 在 学 习 动词 变 位 时 出 错 就 会 被 打手 心 的 话 ， 那 么 无 论 是 小 孩子 还 是 机 
器 最 终 都 会 学 会 “正确 ”的 变 位 方 一 一 而 且 也 会 让 那些 变 位 出 错 的 人 改正 ， 有 时 
候 方式 还 很 粗暴 。 这 就 是 所 谓 的 强化 学 习 〈 reinforcement learning )。 

正 是 这 种 学 习 方式 让 谷歌 的 DeepMind 能 够 通过 一 个 人 工 智能 解决 大 量 街机 游 
戏 ， 这 个 人 工 智 能 只 能 读 取 屏幕 上 每 个 像素 的 颜色 ， 而 它 的 目标 只 是 尝试 达到 最 
高 分 ， 也 就 是 说 分 数 扮 演 了 “ 胡 葛 上 个 ”和 “大 棒 ” 的 角色 。 令 人 惊异 的 是 ， 这 就 
够 了 。 在 只 依赖 分 数 的 情况 下 ,谷歌 DeepMind 成 功 超越 了 人 类 的 游戏 水 平 "I 

但 选择 “ 胡 葛 下 加 大 棒 ” 可 能 会 带 来 出 人 意料 的 后 果 。2016 年 ， 微 软 发 布 了 
名 为 Tay 的 人 工 智能 ， 它 接受 发 送 到 Twitter 账号 @TayTweets 的 指令 。 问 题 在 于 ， 
Tay 的 学 习 方式 是 强化 学 习 ， 其 中 特别 考虑 了 人 们 对 它 发 布 的 推 文 的 反应 。 不 到 
24 小 时 ，Twitter 上 的 钓鱼 网 民 就 将 Tay 变 成 了 一 个 种 族 主义 的 “纳粹 怪物 ”"， 它 
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否认 纳粹 大 屠杀 的 存在 ， 而 且 支 持 实 行 新 的 种 族 灭绝 。 不 用 说 ，Tay 很 快 就 被 微软 
关闭 了 。 

然而 ， 这 个 故事 对 于 我 们 自身 的 道德 价值 形成 的 方式 来 说 意味 深长 。 我 们 的 
道德 体系 部 分 是 通过 强化 学 习 构 筑 而 成 的 ， 这 也 就 解释 了 为 什么 地 理 位 置 或 者 社 
会 地 位 相近 的 个 体 通常 有 着 相当 相似 的 道德 观点 。 我 们 之 所 以 会 有 这 些 想法 ， 很 
大 程度 上 都 是 因为 周围 的 社会 与 文化 环境 促使 我 们 思考 那些 想法 ， 其 中 也 包括 道 


德 问题 。 
































大 多 数 人 的 道德 ? 





一 个 经 常 出 现 的 雇 误 是 ， 人 们 会 赋予 民主 一 个 明确 定义 的 目标 ， 即 表达 公民 
的 个 人 意愿 。 我 们 经 常 听 到 这 样 的 话 : 人 民 的 意愿 必须 被 遵循 。 然 而 社会 并 不 是 
拥有 唯一 一 种 意愿 的 个 体 。 即 使 社会 中 的 每 个 成 员 都 有 一 组 前 后 一 致 的 偏好 ， 著 
名 的 孔 多 寨 悖 论 与 阿 罗 不 可 能 性 定理 也 会 指出 ， 不 存在 任何 自然 的 方法 可 以 从 个 
体 的 偏好 顺序 得 出 整个 群体 的 偏好 ， 至 少 除 了 那些 不 如 人 意 的 方法 ， 比 如 独裁 40 

所 以 ， 在 过 去 数 千年 的 时 间 里 ， 人 类 群体 中 产生 的 集体 决策 基本 上 是 少数 几 
个 人 做 出 的 决定 ， 或 者 某 些 花费 很 长 时 间 才 达成 的 共识 ， 而 这 些 共 识 往往 由 鼎 具 
威望 的 人 主导 ， 而 付出 代价 的 就 是 那些 更 内 敛 的 人 。 此 后 ,投票 这 一 发 明 让 公民 
的 意见 得 到 了 体现 。 然 而 时 至 今日 ， 选 举 仍然 具有 某 些 数 学 性 质 ， 可 能 会 助长 两 
党 政治 、 政 治 狂 热 和 策略 性 投票 。 在 最 近 几 十 年 中 ， 人 们 提出 了 不 同 的 奉 代 选举 
机 制 ， 它 们 拥有 更 好 的 数学 性 质 ， 比 如 多 数 判断 选举 (majority judgment ) 和 随机 
孔 多 塞 投票 ( randomized Condorcet voting ) 05。 

但 是 ， 如 果 认 为 选择 民主 投票 机 制 就 足以 解决 道德 规范 的 问题 的 话 ， 那 就 错 
了 。 正 如 我 们 之 前 看 到 的 那样 ， 我 们 的 道德 直觉 有 很 多 不 足 之 处 ， 有 很 大 的 改善 
空间 。 除 此 之 外 ， 有 经 济 学 家 认为 ， 在 投票 时 ， 投 票 者 的 表现 比 一 无 所 知 的 人 更 
糟糕 ， 因 为 他 们 并 不 理性 。 有 些 人 会 出 于 政治 上 的 狂热 而 投票 ， 拒 绝 为 投 出 有 根 
有 据 、 无 怨 无 悔 的 一 票 而 进行 必要 的 准备 。 细 想 一 下 ， 这 并 不 令 人 意外 。 了 解 情 
况 也 有 代价 ， 但 投 出 有 根 有 据 的 一 票 几 乎 不 会 获得 什么 好 处 。 在 这 位 经 济 学 家 看 
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来 ， 投 票 者 的 非 理 性 符合 理性 ng。 

总 而 言 之 ， 社 会 的 道德 目标 似乎 并 不 能 从 公民 的 道德 直觉 中 推演 出 来 ， 而 如 
果 出 发 点 是 这 些 公 民 对 自身 渴望 的 叙述 的 话 ， 那 就 更 不 可 能 了 。 我 们 的 集体 道德 
直觉 似 乎 既 反 复 无 常 又 缺少 根据 ， 既 易于 被 操纵 又 前 后 不 一 ， 而 且 也 不 适应 现代 
生活 。 丹 尼 尔 ， 卡 内 曼 称 :“ 了 解 人 类 偏好 的 逻辑 一 致 性 的 本 来 面目 很 有 好 处 ， 那 
就 是 一 场 毫 无 希望 的 海 市 压 楼 。” 这 并 不 是 道德 判断 ， 卡 内 曼 在 这 里 只 是 尝试 描述 
我 们 自然 的 道德 。 

比如 说 ， 阿 莱 的 实验 就 指出 我 们 的 偏好 违背 了 冯 “' 诺 伊 曼 - 葛根 施 特 恩 公理 71, 
几乎 可 以 确定 我 们 的 道德 也 是 如 此 。 更 具体 地 说 ， 这 意味 着 我 们 有 可 能 认为 情况 
4 在 道德 上 比 情况 B 更 好 ， 情 况 B 在 道德 上 比 情况 C 更 好 ， 而 情况 C 又 比 情况 4 
更 好 。 但 这 样 的 话 ， 所 谓 的 “荷兰 赌 论证 ”( Dutch book) 就 证 明了 庄家 可 以 让 你 
花 点 小 钱 ， 将 赌注 先 从 4 移 到 B， 然 后 从 B 移 到 C， 之 后 又 从 C 回 到 4。 最 终 你 
花 了 钱 ， 情 况 却 没有 改变 ， 只 是 白白 浪费 了 时 间 、 精 力 和 金钱 。 

阿 莱 悖 论 的 这 种 抽象 描述 听 起 来 似乎 很 思 葵 ， 但 如 果 与 之 相关 的 是 涉及 政治 、 
歧视 或 者 我 们 的 价值 观 等 敏感 话题 的 话 ， 我 们 基本 上 不 可 能 意识 到 这 种 前 后 不 一 
致 。 在 整个 社会 的 层次 上 ， 情 况 甚至 更 严重 ， 尤 其 是 因为 有 阿 罗 不 可 能 性 定理 。 
在 所 有 这 些 情况 中 ,我 们 道德 观 的 前 后 不 一 无 论 是 在 个 体 还 是 在 集体 层次 上 ， 都 
会 浪费 大 量 时 间 、 精 力 和 人 金钱。 这 就 促使 我 们 要 先 使 我 们 的 道德 观 更 为 明晰 、 条 
理化 ?。 

这 是 不 是 说 明 我 们 的 道德 直觉 并 不 可 取 ， 尽 量 用 某 种 更 合适 的 道德 代替 它 可 
能 更 妥当 ? 对 于 纯粹 贝 叶 斯 主义 者 来 说 ， 管 案 是 否定 的 。 要 记 住 ,纯粹 贝 叶 斯 主 
义 者 对 于 道德 规范 并 没有 什么 想法 。 

但 是 ， 因 为 我 觉得 你 可 能 非常 希望 谈论 道德 ， 所 以 我 请 你 踏 出 知识 王国 的 疆 
R, (非常 ) 简单 地 探索 一 下 道德 规范 的 领域 。 我 们 会 看 到 各 种 各 样 的 道德 规范 ， 
即使 贝 叶 斯 主义 并 不 是 这 些 道德 的 基础 ， 但 它 在 其 中 仍然 是 一 件 必 不 可 少 的 工 
具 一 一 就 像 数学 的 各 个 分 支那 样 ! 













































































































































































(D 汉 ' 诺 伊 曼 - 莫 根 施 特 恩 定理 特别 证 明了 ， 任 意 前 后 一 致 的 偏好 必定 等 价 于 最 大 化 某 个 分 数 
的 期 望 值 。 我 们 在 本 章 结 尾 会 更 详细 地 叙述 这 一 点 。 
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规范 伦理 学 的 两 种 主要 思路 就 是 义务 论 和 结果 论 。 义 务 论 就 是 对 权利 和 义务 
的 预先 规定 ， 而 结果 论 则 不 考虑 具体 的 行为 ， 道 德 评判 的 唯一 根据 就 是 结果 (或 
者 当事人 在 行动 的 瞬间 相信 会 导致 的 结果 )。 

道德 义务 论 最 重要 的 辩护 人 之 一 就 是 哲学 家 伊 曼 纠 尔 ' 康德 。 康 德 将 道德 义 
务 分 为 两 类 ， 他 把 每 个 类 别 都 称 为 “ 令 式 ”( imperative )。 其 中 一 方面 ， 假 言 令 式 
( hypothetical imperative ) 是 依 情况 而 变 的 义务 ， 也 就 是 为 了 达到 特定 目的 而 进行 
的 行为 ; 男 一 方面 ， 定 言 令 式 (categorical imperative ) 则 是 绝对 的 道德 义务 ,与 具 
体 情况 无 关 。 

康德 认为 ， 定 言 令 式 最 基本 的 性 质 就 是 普 适 性 。 他 曾 这 样 写 道 :“ 只 有 在 你 同 
样 希望 某 个 准则 成 为 普 适 法 则 的 情况 下 ， 你 方 可 依 此 行动 。” 因此， 康德 认为 ， 任 
何 道德 义务 都 要 使 人 们 希望 所 有 人 都 遵守 它 中 。 

出 现在 宗教 准则 、 法 律 文本 和 组 织 章程 中 的 基本 上 就 是 这 种 义务 性 的 道德 ， 
比如 “不 可 杀人 ”“ 无 人 可 无 视 法 律 ”， 等 等 。 这 大 概 并 非 偶 然 。 对 法 官 来 说 ， 检 
验 法 律 是 否 被 遵守 并 由 此 得 出 判决 更 为 简单 。 此 外 ， 义 务 论 思 路 有 利于 司法 判 
决 的 一 致 性 ， 而 很 多 人 将 这 一 点 视 为 定 言 令 式 。“ 人 生 而 自由 ， 在 权利 上 一 律 平 
等 。 1789 年 法 国 的 《人 权 与 公民 权 宣 言 》 第 一 条 就 如 此 写 道 。 

然而 ， 道 德 义 务 论 同样 有 批评 者 。 特 别 是 将 道德 归结 于 少数 几 个 定 言 令 式 这 
一 点 似乎 就 是 一 项 相当 复杂 的 任务 ， 就 像 用 几 句 话 定义 生命 一 样 ， 这 其 至 可 以 说 
是 痴人说梦 。 下 面 就 是 反对 道德 的 义务 论 观 点 的 三 个 理由 。 

首先 ， 无论 义 务 论 的 原则 是 什么 ， 其 中 似乎 总 有 例外 。 最 有 名 的 例子 就 是 康 
做 关于 谎言 的 讨论 。 想 象 一 下 ， 你 正在 和 你 的 两 个 孩子 克 劳 德 和 多 米 尼 克 同 桌 用 
公 ， 一 个 手持 手枪 的 男人 对 你 说 ， 因 为 几 小 时 之 前 你 的 孩子 们 在 公园 里 玩 下 的 时 
太 吵 间 ， 所 以 这 个 人 要 杀 掉 他 们 。 克 劳 德 和 多 米 尼 克 感 觉 这 个 杀手 要 来 ， 所 以 
经 走 开 ， 躲 到 了 地 下 室 。 这 个 杀手 问 你 知 不 知道 你 的 孩子 们 藏 在 了 什么 地 方 。 
即使 在 这 种 情况 下 ， 康 德 仍然 断言 你 有 说 实话 的 道德 义务 。 

在 更 一 般 的 情况 下 ， 我 们 很 难 预见 某 项 义务 原则 是 否 总 是 妥当 (比如 对 于 直 
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觉 上 的 道德 来 说 )。 认真 思考 一 下 ， 即 使 “不 可 杀人 ”的 诚 命 似乎 也 有 例外 一 一 而 
指出 这 一 点 的 思想 实验 一 般 会 牵涉 阿道夫 ' 希特勒 这 个 人 物 ! 要 保证 某 项 道德 原 
则 总 是 正确 的 ,我们 似乎 必须 预见 所 有 可 能 发 生 的 事件 ， 或 者 至 少 所 有 发 生 的 可 
能 性 并 非 无 限 小 的 事件 。 但 人 们 也 会 因此 怀疑 人 类 的 认 知 极限 是 否 真正 足以 保证 
某 个 道德 原则 绝对 正确 。 一 般 来 说 ， 道 德 义 务 论 似乎 过 于 死板 PL 

义务 论 的 第 二 个 局 限 性 在 于 它 的 定义 必定 不 完全 。 我 们 也 看 到 了 ， 要 主张 
“不 可 杀人 ”是 一 条 道德 义务 的 话 ， 我 们 就 必须 首先 定义 生命 、 死 亡 、 谋 杀 、 意 
图 、 自 由 意志 以 及 其 他 大 量 概念 。 但 事实 上 ， 至 少 在 相信 贝 叶 斯 主义 的 情况 下 ， 
所 有 这 些 概念 的 定义 也 必定 不 完全 。 或 者 应 该 说 ， 正 如 我 们 在 第 20 章 谈 到 过 的 那 
样 ， 某 个 概念 的 现实 性 依赖 于 我 们 考虑 的 模型 ， 但 任何 人 对 现实 的 模型 都 不 会 与 
其 他 人 完全 一 致 。 此 外 ， 与 猫 的 概念 一 样 ， 对 前 面 那些 概念 的 任何 严格 形式 化 都 
可 能 需要 数 十 亿 字 节 的 信息 来 描述 ， 而 任何 人 都 没有 足够 的 时 间或 耐心 去 阅读 并 
理解 这 些 定义 Dol, 

更 糟糕 的 是 ， 义 务 论 有 很 大 的 风险 ， 它 会 导致 人 们 牌 曲 义务 原则 中 词语 的 定 
义 。 这 是 因为 ， 如 果 想 做 到 符合 道德 的 话 ， 牌 曲 义 务 原则 的 解释 要 比 改变 自己 的 
行为 容易 得 多 。 最 大 的 问题 在 于 ， 一 般 来 说 这 种 策略 很 大 程度 上 是 下 意识 的 。“ 直 
觉 先行 ， 然 后 说 理 。” 乔纳森 ' 海 特 如 此 说 道 。 我 们 在 毫 无 察觉 的 情况 下 就 被 引导 
到 了 算 改 义务 原则 的 解释 这 一 道路 上 ， 以 求 无 须 调整 自身 行为 也 能 合乎 道德 。 这 
就 解释 了 为 什么 许多 关于 道德 义务 的 辩论 都 只 是 一 场 关 于 词语 定义 的 永 无 止境 而 
又 可 翡 的 战争 一 一 尤其 是 在 参与 者 尝试 为 自身 行为 的 优越 性 辩护 的 时 候 。 

最 后 ， 义 务 论 的 第 三 个 局 限 性 就 在 于 ， 它 没有 区 分 优 劣 不 同 的 选项 。 义 务 论 
通常 会 列 出 一 些 应 当做 或 者 不 能 做 的 行为 ， 但 如 果 我 们 必须 在 几 个 应 当做 的 行为 
之 中 选择 的 话 ， 那 应 该 怎么 做 ?如果 必须 在 黑 死 病 和 霍乱 之 间 选 择 一 个 的 话 又 该 
怎么 做 ? 

伊 萨 克 ' 阿 西 莫 夫 在 他 的 科幻 小 说 中 提出 了 一 个 有 关机 器 人 道德 的 框架 ， 其 
中 列 出 了 多 种 行动 之 间 的 优先 顺序 。 根 据 这 一 顺序 ， 机 器 人 应 该 最 优先 保护 人 类 
不 受伤 害 。 只 有 在 满足 第 一 法 则 的 前 提 下 ， 机 器 人 才 应 该 遵循 人 类 的 指令 。 然 而 ， 
指望 这 样 一 张 优先 列表 能 够 解决 所 有 与 道德 决策 相关 的 问题 简直 是 天 方 夜 谭 。 这 
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是 因为 应 该 采取 的 行动 不 仅 取 决 于 所 有 可 能 的 行动 ， 还 取决 于 在 什么 情景 下 进行 
决策 。 但 是 可 以 想象 的 情景 数量 众多 ,并且 呈 指数 增长 。 列 出 在 所 有 情况 下 可 以 
采取 的 所 有 行动 ， 就 相当 于 写 出 一 个 算法 ,能够 在 所 有 情境 下 判断 出 应 该 执行 什 
么 行动 。 但 我 们 基本 上 可 以 确定 ， 这 样 的 算法 会 拥有 巨大 的 所 罗 门 诺 夫 复 杂 度 。 
无 论 是 对 人 类 还 是 对 机 顺 而 言 ， 这 种 算法 的 编写 、 读 取 和 应 用 完全 不 切实 际 。 
结果 论 者 与 义务 论 者 恰好 相反 ， 他 们 不 接受 任何 定 言 令 式 ， 重 要 的 只 有 结 
当 且 仪 当 某 个 行动 能 导向 合适 的 结果 时 ， 它 才 合 乎 道德 。 只 要 结果 的 确 可 取 ， 那 
就 说 明 手 段 正当 。 

































































知识 是 合理 的 目的 吗 ? 


现在 剩 下 的 工作 就 是 确定 什么 结果 才 算 可 取 。 我 们 对 社会 真正 的 期 望 是 什 
4? 文明 的 最 终 目 标 是 什么 ? 我 们 在 客观 上 有 什么 作用 ?这 就 是 结果 论 者 要 回答 
的 根本 问题 。 

科学 工作 者 经 常 提倡 对 知识 的 渴望 。 将 知识 作为 社会 的 目标 ， 这 在 道德 上 成 
立 吗 ? 要 求 大 多 数 人 拥有 知识 ， 这 是 否 的 确 合理 ?应 不 应 该 要 求 所 有 人 都 否 下 那 
颗 红色 药丸 ”大 概 不 行 。 实 际 上 ， 即 使 只 是 将 知识 定 为 科学 的 目标 ， 也 会 导致 许 
多 奇怪 的 结果 。 

问题 在 于 世界 既 庞 大 又 复杂 。 这 个 世界 中 可 以 知晓 的 事物 的 数量 远 远 超越 了 
我 们 的 认 知 能 力 。 欧 内 斯 特 ' 卢 瑟 福 甚 至 主张 “所 有 科学 要 么 是 物理 ， 要 么 就 是 
邮 ”。 庞 加 莱 也 这 样 阅 :“ 事 实 的 堆砌 与 一 门 科学 的 距离 并 不 比 一 堆 石 头 与 一 座 房 
屋 的 距离 近 。” 我 个 人 也 没有 任何 耐心 去 背诵 那 些 由 零碎 知识 组 成 的 列表 。 

与 其 只 关心 数据 ， 人 们 更 希望 寻求 这 些 数据 中 暗含 的 理论 ， 常 用 的 方法 就 是 
应 用 贝 叶 斯 公式 。 但 这 样 的 话 ， 目 标 是 什么 ”就 是 进行 预测 吗 ” 我 们 可 不 可 以 认 
为 尝试 得 出 正确 结论 就 是 合理 的 目的 ? 

答案 绝对 是 否定 的 。 即 使 是 在 KL 散 度 这 种 精细 的 意义 上 ， 尝 试 得 出 正确 结 
论 也 有 局 限 性 。 

这 是 因为 ， 要 得 到 正确 的 结论 ， 只 需要 停留 在 容易 预测 的 问题 上 。 我 们 唯一 
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需要 做 的 就 是 只 考虑 那些 我 们 已 经 非常 了 解 的 事物 ， 这 也 是 我 们 自然 会 去 做 的 事 
情 ， 我 们 会 将 自己 困 在 熟悉 的 日 常 之 中 一 一 有 时 候 甚 至 主张 这 种 日 常 就 是 现实 。 

所 以 对 于 总 希望 得 到 正确 结论 的 人 来 说 ， 好 奇 心 是 个 糟糕 的 策略 。 如 果 工 程 
师 不 知道 自己 在 做 什么 ， 那 就 最 好 停 手 。 相 反 ， 研 究 者 在 职业 生涯 中 常常 犯错 。 
没有 人 比 数学 家 更 经 常 犯错 ， 他 们 整 天 都 在 草稿 纸 上 涂 涂改 改 。 如 果 研 究 者 知道 
自己 在 做 什么 ， 那 就 最 好 停 手 。 

德里 克 … 穆 勒 在 他 的 视频 频道 Veritasium 上 重 现 的 一 个 实验 突出 了 这 个 问题 的 
价值 外。 德里 克 … 穆 勒 走 到 街 上 向 行人 提问 ， 让 行人 猜测 他 脑海 里 的 一 条 秘密 规 
则 。 他 给 出 的 提示 是 数列 2、4、8 符合 这 一 规则 。 被 问 到 的 行人 可 以 举 出 由 3 个 
数组 成 的 其 他 数列 ， 然 后 德里 克 ' 穆 勒 会 告诉 他 们 这 个 数列 是 否 符 合 那 条 秘密 规 
则 。 这 些 参 与 者 的 做 法 全 都 一 样 ， 他 们 会 问 (这 可 能 还 经 过 了 无 意识 的 贝 叶 斯 计 
算 ) 这 条 秘密 规则 是 不 是 后 一 个 数 是 前 一 个 数 的 2 倍 。 德 里 克 … 穆 勒 说 不 是 ， 
后 他 们 就 会 举 出 16、32、64, 或 者 3、6、12， 又 或 者 10、20、40。 德 里 克 … FI 
每 一 次 的 回答 都 一 样 : 是 的 ， 这 个 数列 符合 秘密 规则 ， 但 规则 并 不 是 后 一 个 数 是 
前 一 个 数 的 2 倍 。 那 些 参 与 者 只 能 旺 口 无 言 。 

问题 在 于 ， 参 与 者 的 答案 背后 的 动机 总 是 对 做 出 正确 预测 的 渴望 。 这 些 参与 
者 的 脑海 里 有 自己 想 出 来 的 规则 ， 他 们 一 直 在 尝试 确认 这 条 规则 一 一 即使 德里 
xu 穆 勒 已 经 否定 了 这 条 规则 。 尽 管 如 此 ， 他 们 还 是 能 够 做 出 许 许 多 多 正确 预测 。 
如 果 他 们 的 目标 就 是 别人 肯定 自己 的 回答 ， 那 么 他 们 的 策略 的 确 是 最 优 的 ! 
要 找到 这 条 秘密 规则 ， 我 们 就 必须 被 否定 ， 必 须 尝试 犯错 ， 必 须 愿 意 否 定 自 
己 的 直觉 。 当 德里 克 … 穆 勒 要 求 参与 者 这 样 做 时 ， 他 们 就 提出 了 5、10、15, 或 者 
2、4、7， 以 及 10、9、8 等 数列 。 德 里 克 … 穆 勒 分 别 对 这 些 数列 的 回答 表示 肯定 、 
肯定 和 和 否定 ! 这 些 参 与 者 就 立刻 发 现 了 那 条 秘密 规则 : 对 德里 克 “' ik, R 
要 数列 是 递增 的 ， 那 么 答案 就 是 肯定 的 ”。 

这 样 的话 ， 尝 试 改进 自身 贝 叶 斯 置信 和 度 的 贝 叶 斯 主义 者 不 会 总 是 尝试 得 出 正 
确 结论 。 恰 恰 相 反 ， 他 们 会 尝试 在 那些 所 知 不 多 的 领域 中 进行 试验 。 他 们 会 党 













































































































































































四， 其实 有 一 个 研究 领域 专门 尝试 找 出 应 该 进行 什么 实验 的 最 优选 择 ， 其 中 有 一 个 属于 贝 叶 斯 主 
义 的 分 支 ， 叫 作 贝 叶 斯 实验 设计 ( Bayesian experimental design ). 
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将 自己 暴露 在 预测 错误 之 下 。 因 此 ， 以 得 出 正确 结论 作为 目的 并 不 可 取 。 

更 糟糕 的 是 ,为 了 达到 总 是 得 出 正确 结论 的 幻觉 ,我们 的 大 脑 以 及 其 中 的 大 
量 认 知 偏差 总 是 会 否定 所 有 自身 犯错 的 情况 ， 而 将 那些 自身 正确 的 情况 奉 为 在 泉 。 
最 麻烦 的 是 ， 这 种 做 法 可 能 是 有 意 而 为 的 ， 也 可 能 是 出 于 无 意 的 。 这 就 是 著名 的 
证 实 偏差 ( confirmation bias )。 这 种 认 知 偏差 极其 危险 ,会 一 直 将 我 们 推 向 过 度 诠 
释 与 自信 过 度 的 境地 。 























效用 主义 








最 主流 的 结果 论 道德 哲学 断言 ， 我 们 需要 达到 的 目标 就 是 最 多 数 人 最 大 的 幸 
。 这 就 是 所 谓 的 效用 主义 〈nutilitarianism， 又 译 “功利 主义 ”)。 效 用 主义 者 认 
， 如 果 某 项 行动 最 终 能 让 更 多 的 人 变 得 更 幸福 ， 那 么 它 就 符合 道德 。 剩 下 的 就 
是 确定 能 精确 衡量 幸福 的 标准 ， 以 及 确定 我 们 所 说 的 “最 多 数 人 ”是 什么 意思 。 
我 们 也 可 以 提出 其 他 问题 ， 比 如 是 否 应 该 考虑 公平 性 ， 未 来 的 幸福 是 否 拥有 等 同 
于 当下 幸福 的 价值 ， 或 者 是 否 存在 其 他 我 们 和 希望 达到 的 目标 ， 比 如 说 生物 多 样 性 
或 者 知识 。 可 惜 效用 主义 的 定义 并 不 明确 ， 它 有 着 大 量 不 同 的 版 本 。 

我 不 打算 在 这 里 列 出 效用 主义 遇 到 的 所 有 困难 。 道 德 哲学 是 一 个 激动 人 心 而 
微妙 难 解 的 话题 ， 但 它 并 不 是 这 本 书 的 主题 。 虽 然 如 此 ， 效 用 主义 道德 中 有 一 个 
令 人 着 迷 的 维度 ， 即 使 是 效用 主义 的 支持 者 也 经 常 忽视 这 一 点 : 无 论 是 一 般 而 言 
的 结果 论 道德 哲学 ， 还 是 效用 主义 这 一 特殊 情况 ， 它 们 都 需要 出 色 的 知识 哲学 作 
为 基础 。 这 是 因为 ， 如 果 我 们 尝试 让 人 们 感到 幸福 ,那么 就 必须 知道 什么 会 让 人 
感到 幸福 ， 还 有 要 怎么 做 才能 达到 这 一 目的 。 或 者 说 ， 在 更 善 遍 的 意义 上 ， 为 了 
确定 应 该 着 手 进 行 什么 行动 ， 我 们 必须 首先 预言 可 以 想象 的 各 种 行动 会 产生 的 后 
果 。 也 就 是 说 ， 一 名 合格 的 效用 主义 者 必须 先 研究 认识 论 ; 而 如 果 你 相信 你 正在 
读 的 这 本 书 的 内 容 的 话 ， 那 么 他 也 应 该 是 一 位 贝 叶 斯 主义 者 。 

对 于 效用 主义 者 来 说 ， 只 要 自己 对 各 种 意识 形态 带 来 的 后 有 果 ， 以 及 它们 在 当 
前 情况 下 的 好 处 和 坏处 没有 足够 的 认识 ， 那么 就 不 能 做 出 这 样 的 判断 一 一 至 少 不 
能 做 出 置信 度 很 高 的 判断 。 因 此 ， 乔 纳 森 : 海 特 断言 ， 我 们 常常 低估 所 谓 道德 资 
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本 《〈moral capital ) ?! 的 价值 ， 这 指 的 是 所 有 社会 结构 ， 它 们 通常 并 不 显眼 ， 但 如 果 
没有 这 些 结构 ， 我 们 的 文明 就 会 月 演 。 对 于 效用 主义 者 来 说 ， 在 给 出 社会 应 该 如 
何 行动 的 明确 意见 之 前 ， 坚 实 掌 握 心理 学 、 经 济 学 和 政治 科学 等 社会 科学 是 一 项 
必 不 可 少 的 先决 条 件 。 与 科学 相 比 ，( 结果 主义 ) 道德 更 要 “尽量 避免 得 出 结论 ”。 

不 委 的 是 ， 绝 大 多 数 公民 对 于 社会 科学 基础 概念 的 理解 极其 匮乏 。 更 糟糕 的 
是 ， 绝 大 多 数 公民 对 这 些 话题 有 着 巨大 的 误解 ， 而 且 不 愿意 花 精 力 改变 这 一 状况 。 
这 就 让 贾 森 ' 布 伦 南 等 几 位 知识 分 子 站 到 了 反对 民主 的 立场 上 。 他 们 的 主要 论点 
本 质 上 属于 效用 主义 : 如 果 幸 福 就 是 目的 ， 那 么 社会 给 所 有 成 员 强加 的 某 些 决策 
就 会 明显 比 另 一 些 决策 更 好 ， 而 比 起 一 般 的 投票 者 而 言 ， 窒 窒 几 位 专家 进行 的 决 
策 也 必定 更 符合 效用 主义 的 目的 。 

专业 性 并 非 效 用 主义 者 反对 民主 的 唯一 论点 。 据 贾 森 … 布 伦 南 的 说 法 ,， “政治 
狂热 使 人 变 得 糊涂 而 腐败 "。 人 们 搜集 的 信息 越 多 ， 心 中 的 政治 狂热 就 拥有 越 大 的 
控制 力 ， 强 迫 人 们 必须 捍卫 某 个 党 派 。 众 多 实验 也 指明 了 这 一 点 外。 这 就 会 让 人 
们 激烈 地 批判 那些 违反 直觉 的 理念 ， 并 拒绝 任何 妥协 。 这 种 狂热 让 人 结 仇 ， 并 且 
让 人 异 恨 反对 自己 的 人 。 所 以 布 伦 南 认为 ， 所 有 个 体 都 积极 参与 政治 生活 的 社会 
并 不 是 理想 的 社会 ; 所 有 个 体 都 花 时 间 做 自己 热衷 的 事情 ， 那 才 是 理想 的 社会 5。 

民主 并 不 是 唯一 一 个 被 效用 主义 者 质疑 的 现代 社会 支柱 。 效 用 主义 者 同样 反对 
互惠 互利 的 道德 义务 ， 即 使 在 所 有 主要 宗教 中 都 能 找到 这 一 义务 。“ 如 果 你 觉得 会 
伤害 自己 ， 就 不 要 如 此 伤害 别人 ”“ 爱 邻 人 如 同 自己 ”“ 己 所 不 欲 , 勿 施 于 人 ”“ 你 
们 任何 人 都 不 算 真 正 归 信 ， 除 非 他 为 其 弟兄 所 祈 望 的 正如 他 为 自己 所 祈 望 的 "。 你 
看 到 这 个 原则 的 局 限 性 了 吗 ? 它 预先 假设 了 其 他 人 都 与 你 有 着 相同 的 偏好 。 

效用 主义 者 与 此 正好 相反 ， 他 们 会 考虑 不 同 个 体 有 不 同 偏 好 的 这 个 事实 。 对 
于 不 把 自由 感 放 在 首位 的 人 来 说， 他 们 可 能 更 希望 别人 强迫 他 们 远离 新 体验 的 诱惑 ， 
而 另 一 个 人 可 能 会 将 自由 视 若 珍宝 。 效 用 主义 者 最 终 对 待 这 两 种 人 的 方式 会 相当 
不 同 ， 而 对 待 这 些 人 的 方式 也 可 能 不 同 于 效用 主义 者 本 身 希 望 被 对 待 的 方式 P 

效用 主义 者 面临 的 问题 ， 就 是 他 们 对 于 别人 《现在 或 者 未 来 ) 的 偏好 并 没有 
先 验 的 确切 认识 。 为 了 确定 这 些 俩 好 ， 他 们 必须 利用 某 种 知识 哲学 。 而 如 果 你 相 
信 这 本 书 的 内 容 的 话 ， 那 么 他 们 就 应 该 是 贝 叶 斯 主义 者 。 
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贝 叶 斯 结果 论 者 




















因此 ， 贝 叶 斯 效用 主义 者 应 该 利用 自 导 的 偏见 。 如 果 要 以 最 有 利于 其 他 人 过 
福 的 方式 行动 的 话 ， 那 么 这 些 偏见 必 不 可 少 。 当 贝 叶 斯 效用 主义 者 出 席 匡 礼 时 ， 
他 们 会 假设 人 们 不 欢迎 那些 恶毒 的 笑话 :如果 他 们 参加 的 是 数学 讲座 ， 那 么 他 们 
会 假设 其 他 参加 的 人 想 要 认真 销 研 学 术 ; 如 果 他 们 在 迪斯科 舞厅 ,那么 他 们 就 会 
假设 其 他 人 不 想 讨 论 贝 叶 斯 公式 。 

然而 ,合格 的 贝 叶 斯 主义 者 不 能 忘记 “所 有 模型 都 是 错 的 "。 此 外 ， 即 使 是 贝 
叶 斯 式 的 偏见 也 可 能 导致 错误 的 预测 。 然 而 ， 正 如 我 们 在 第 9 章 中 讨论 过 的 那样 ， 
根据 某 些 预测 来 行动 的 话 ， 无 论 这 些 预 测 是 否 正确 ， 这 样 做 可 能 深 深 伤害 别人 。 
即使 贝 叶 斯 效用 主义 者 认为 某 个 笑话 有 非常 大 的 可 能 性 会 引 人 发 笑 ， 但 如 果 这 个 
笑话 有 不 可 忽略 的 概率 会 引发 严重 误解 的 话 ， 他 也 会 因此 三 绒 其 口 。 这 也 解释 了 
为 什么 人 们 在 头 儿 次 约会 时 都 如 此 小 心 到 经 。 在 必须 学 会 如 何 认识 别人 却 不 冒犯 
对 方 时 ， 我 们 难免 如 履 薄 冰 。 这 也 是 贝 叶 斯 效用 主义 者 接触 陌生 人 时 的 做 法 ， 因 
为 他 们 必定 很 不 了 解 陌生 人 的 偏好 。 

贝 叶 斯 效用 主义 者 应 当时 常 考 虑 对 方 的 想法 与 喜好 ， 他 们 不 会 根据 预测 的 平 
均值 来 行动 ， 而 是 注意 避免 那些 有 可 能 会 冒犯 对 方 的 话语 和 动作 ， 即 使 这 些 话语 
和 动作 对 自己 来 说 不 算 冒 犯 , 而 且 冒 犯 对 方 的 可 能 性 相对 来 说 也 很 低 。 此 外 ， 
贝 叶 斯 效用 主义 者 也 不 会 忽略 对 方 很 有 可 能 更 清楚 自身 偏好 的 事实 ， 这 也 就 解释 
了 为 什么 贝 叶 斯 效用 主义 者 通常 更 倾向 于 让 对 方 自由 选择 ， 让 对 方 做 自己 喜欢 的 
事情 。 

从 更 普 适 的 角度 来 说 ， 所 有 贝 叶 斯 主义 者 都 会 不 断 尝 试 量化 自身 的 无 知 程度 ， 
由 同样 会 尝试 估计 对 方 的 无 知 程度 一 一 我 们 之 前 已 经 看 到 ， 这 种 无 知 程度 一 般 并 
不 会 对 应 着 缺乏 自信 。 所 以 ， 如 果 贝 叶 斯 结果 主义 者 估计 其 他 人 知道 的 信息 比 自 
己 更 多 ， 而 且 认为 这 些 知晓 更 多 的 人 会 出 于 善意 做 出 决策 的 话 ， 那 么 为 了 不 妨 得 
辩论 ， 闭 口 不 谈 自己 的 意见 就 成 了 贝 叶 斯 结果 主义 者 的 道德 义务 ， 但 他 们 还 是 可 
以 参与 讨论 ， 质 疑 其 他 人 提出 意见 的 基础 ， 考 验 对 方 的 专业 程度 ， 厘 清 对 方 的 立 
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场 ， 或 者 尽量 从 对 方 身上 学 习 "。 如 果 贝 叶 斯 结果 主义 者 不 完全 理解 那些 更 有 能 
的 人 提出 的 论证 ， 却 相信 这 些 人 所 知 甚 多 而 且 怀 抱 善意 的 话 ， 那 么 他 们 就 会 尝试 
让 这 些 人 代替 自己 和 所 知 更 少 的 人 进行 决策 59。 

最 后 ， 需 要 强调 一 个 重点 : 贝 叶 斯 结果 论 者 一 直 都 在 考虑 不 确定 性 。 一 般 来 
说 ， 他 们 的 决策 过 程 就 是 统计 决策 论 的 经 典 例子 。 首 先 ， 他 们 会 问世 界 的 所 有 可 
能 状态 x 赋予 一 个 道德 分 数 /M(x)。 状 态 x 越美 好，M(x) 就 越 大 。 对 于 贝 叶 斯 结 
果 论 者 来 说 ,采取 能 够 最 大 化 道德 分 数 期 望 值 E,[AM (x)la] 的 行动 就 是 一 项 道德 义 
务 。 值 得 注意 的 是 ,在 同 构 的 意义 上 ， 这 是 唯一 能 够 符合 汉 “' 诺 伊 曼 一 葛根 施 特 
恩 公 理 的 道德 观点 ， 因 此 不 会 受 阿 莱 悖 论 的 影响 PAL 

贝 叶 斯 结果 论 这 个 框架 同样 能 让 我 们 处 理 那些 发 生意 外 的 可 能 性 很 小 ， 但 后 
果 却 极其 严重 的 问题 。 假 设 有 两 个 选项 久 和 VV ， 考 虑 下 面 三 个 可 能 的 后 果 : ©, e 
和 和 全。 假设 针对 应 的 是 什么 也 不 做 ,而且 必然 导致 @; 而 VY 是 个 有 风险 的 行动 ， 可 
能 导致 全 或 者 全。 

人 们 有 时 候 会 出 于 预防 原则 而 倾向 选择 X。 然 而， 全 也许 非常 不 可 能 发 生 , 但 
不 地 的 是 ， 援 引 预 防 原 则 不 一 定 会 让 人 们 计算 生 的 概率 。 然 而 ， 即 使 向 会 带 来 灾 
难 ， 贝 叶 斯 结果 论 者 仍 认为 有 时 候 采 取 行动 VY 也 是 合理 (或 不 合理 ) 的 。 用 更 严 
着 的 说 法 表述 ， 贝 叶 斯 结果 论 者 首先 会 给 不 同 的 结果 打分 。 如 有 果 生 真 的 会 带 来 巨 
大 灾难 ， 那 么 我 们 可 以 设想 MM (=0，M(@)= 一 1， 以 及 M (如 = 一 10”。 为 了 确定 
到 底 应 该 实行 行动 X 还 是 ， 贝 叶 斯 结果 主义 者 接 下 来 会 计算 分 数 的 期 望 值 。 什 么 
都 不 做 的 得 分 就 是 E.[MCOIX]=M(®@)= 一 1。 
那么 如 果 执 行 V 的 话 呢 ?7 贝 叶 斯 结果 论 者 的 回答 就 包含 在 执行 V 的 得 分 期 望 计 
算 之 中 : 




























































































































































































Es [M(z)|V] = M(9)P[9| V] + MAPA] = -10° PA] 





























But, S$EDUSELMQOIVIZ ELM GOIIC] 时 ， 贝 叶 斯 结果 论 者 才 会 希望 执行 V， 


























(D 在 实际 生活 中 ， 正 如 我 们 在 第 S 章 中 讨论 过 的 那样 ， 从 教学 的 角度 来 说 ， 大 声 表达 自己 的 偏 
见 非 常 有 用 ， 可 以 更 好 地 意识 到 这 些 偏见 并 进行 修正 。 数 学 学 习 一 般 就 是 这 种 情况 。 然 而 如 
果 辩 论 的 目的 是 进行 决策 的 话 ， 那么 为 了 改正 你 自己 的 偏见 而 拖 慢 整个 决策 过 程 ， 就 可 能 不 
大 合适 了 。 
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而 这 对 应 的 是 PILAIY] 三 10”。 也 就 是 说 ， 贝 叶 斯 结果 论 者 的 决策 完全 由 行动 VY 导 
致 四 的 概率 所 决定 。 与 其 投身 于 永 无 休止 的 辩论 之 中 ， 贝 叶 斯 结果 论 者 更 愿意 优 
先进 行 这 一 概率 的 佑 计 一 一 还 有 确定 这 一 估计 的 不 确定 性 ， 以 及 为 了 降低 佑 计 的 
不 确定 性 所 需要 的 行动 ， 和 降低 不 确定 性 需要 付出 的 代价 。 

我 个 人 认为 ， 我 们 每 个 人 都 可 以 从 贝 叶 斯 结果 论 者 身上 学 到 不 少 东 西 ， 即 使 
我 们 只 和 希望 成 为 半 个 结果 论 者 。 特 别 是 ， 哪 怕 只 是 希望 与 贝 叶 斯 结果 论 者 有 半分 
相似 ， 也 必须 先 衡量 自身 无 知 的 程度 。 不 幸 的 是 ， 在 考虑 道德 问题 时 ， 我 们 并 不 
习惯 这 种 做 法 。 我 兽 经 组 织 过 一 个 关于 “人 工 智能 的 道德 ”的 公开 辩论 。 虽 然 在 
我 看 来 ， 这 个 主题 的 讨论 需要 大 量 专业 知识 ， 但 没有 一 个 参与 者 提出 过 问题 。 在 
这 种 辩论 之 中 ， 人 们 迫不及待 将 自己 的 看 法 强加 于 别人 身上 ， 甚 至 宣扬 自己 的 种 
种 美德 。 我 们 倾向 于 在 对 自身 无 知 程度 进行 任何 衡量 之 前 就 得 出 了 结论 。 

然而 ， 正 如 我 们 在 这 本 书 中 看 到 的 那样 ， 我 们 的 道德 直觉 一 直 处 于 明显 的 自 
信 过 度 之 中 。 即 使 我 们 心中 有 效用 主义 的 基础 ， 但 那些 不 符合 贝 叶 斯 主义 的 错误 
偏见 导致 的 行动 通常 不 能 提高 整体 的 地 福 。 更 糟糕 的 是 ， 自 信 过 度 会 阻止 我 们 改 
正 这 些 偏见 。 为 了 达到 更 高 的 道德 水 准 ， 我 们 似乎 应 该 将 与 自信 过 度 的 斗争 放 在 
首要 位 置 。 然 后 在 理想 情况 下 ， 我 们 由 此 开始 熟悉 社会 科学 与 贝 叶 其 公式， 改进 
自身 关于 用 来 达成 目的 的 手段 效率 如 何 的 置信 度 ， 无 论 是 出 于 效用 主义 还 是 其 他 
目的 。 

因此 ， 这 本 书 让 我 们 得 出 了 以 下 这 个 惊人 的 结论 : 无 贝 叶 斯 不 成 道德 。 






























































































































































结语 


我 只 能 请 你 多 花 时 间 思 索 这 个 惊人 的 结论 。 我 斗 胆 更 进一步 期 望 这 本 书 能 侯 
打破 你 此 前 对 逻辑 、 知 识 以 及 各 个 方面 认 知 的 看 法 。 我 也 期 望 这 本 书 能 够 帮助 你 
更 好 地 确定 科学 方法 的 局 限 性 。 我 还 期 望 这 本 书 能 够 帮助 你 怀疑 自己 的 自信 过 度 ， 
因为 你 很 可 能 深 受 其 害 。 我 同样 期 望 这 本 书 能 让 你 隐约 看 到 如 何 更 好 地 学 习 与 获 
取 知识 。 

人 们 在 处 理 “ 现 实 ” 世 界 的 问题 时 ， 经 常 认为 数学 和 哲学 与 之 毫 不 相干 。 而 



































364 | 贝 叶 斯 的 博弈 : 数学 、 思 维 与 人 工 智能 








人 们 在 谈论 日 常 而 具体 的 事物 时 ， 也 通常 觉得 这 个 领域 无 须 数学 博士 学 位 就 能 理 
解 。 这 就 是 严重 的 自信 过 度 。 正 如 约翰 汉 ' 诺 伊 曼 所 说 :“ 如 果 有 人 不 相信 数学 
是 简单 的 ， 那 是 因为 他 没有 意识 到 人 生 有 多 复杂 。” 我 们 无 法 理解 乌鸦 悖 论 ， 无 法 
理解 为 什么 要 选择 公立 医院 而 不 是 私人 诊所 ， 无 法 理解 指数 增长 有 多 疯狂 ， 这 种 
能 力 的 缺失 理应 迫使 我 们 怀疑 在 “真实 ”世界 中 自 认为 已 经 理解 的 东西 。 

因此 ， 如 果 你 的 部 分 道德 观 属于 结果 主义 ， 那 么 贝 叶 斯 主义 就 应 该 颠覆 了 
你 对 道德 原则 的 依恋 ， 因 为 如 果 某 个 行为 的 好 坏 取决 于 结果 的 话 ， 那 么 ， 即 使 它 
们 并 非 唯一 因素 ， 我 们 也 必须 预测 这 些 结果 ， 以 及 其 他 可 能 行为 导致 的 结果 。 然 
而 俗话 也 说 :“ 预 测 很 难 ， 预 测 未 来 更 难 。” 我 希望 已 经 向 你 好 好 展示 了 预测 有 多 
困难 。 

我 们 看 到 ， 即 使 是 埃 尔 德 什 : 帕 尔 也 无 法 在 极其 简化 的 情况 下 正确 应 用 贝 叶 
斯 公式 ; 所 罗 门 诺 夫 妖 必须 违反 物理 法 则 才能 执行 所 有 贝 叶 斯 计算 ; 为 了 得 到 与 纯 
粹 贝 叶 斯 主义 者 类 似 的 合理 预测 ， 实 用 贝 叶 斯 主义 者 必须 轧 转 于 复杂 度 理论 、 储 
存 空间 最 优 管理 与 MCMC 抽样 之 间 。 这 应 该 迫使 我 们 变 得 更 谦虚 ， 避 免 自己 常常 
表现 出 的 严重 自信 过 度 。 尤 其 是 在 道德 问题 上 ,我 们 “要 尽量 避免 得 出 结论 ”。 

但 这 并 不 是 本 书 的 主要 目的 。 正 如 在 第 1 章 中 所 说 的 那样 ， 我 近 几 年 对 认识 
论 的 长 久 思考 让 我 放弃 了 所 请 的 科学 方法 和 频率 主义 。 后 来 ,我 由 此 转变 为 贝 叶 
斯 主义 者 ， 尤 其 是 在 接触 到 所 罗 门 诺 夫 妖 之 后 ， 我 变 成 了 “极端 ” 贝 叶 斯 主义 者 。 
我 希望 已 经 成 功 说 服 你 ， 相 信 这 种 转变 的 理由 并 非 完 全 脱离 理性 ， 我 也 希望 能 帮 
助 你 隐约 看 到 目前 赢得 我 绝 大 部 分 置信 度 的 知识 哲学 的 大 致 轮廓 。 

但 最 重要 的 是 ,我 希望 你 能 喜欢 这 段 探索 贝 叶 斯 主义 的 基础 和 推论 必 经 的 旅 
程 ， 并 享受 到 探索 众多 学 科 的 乐趣 。 这 些 学 科 对 贝 叶 斯 主义 的 理解 和 诠释 来 说 非 
常 有 用 ， 无 论 是 理论 计算 机 还 是 认 知 科学 ， 或 者 演化 生物 学 和 统计 物理 学 。 我 希 
望 你 喜欢 奥 卡 姆 剃刀 的 证 明 、 对 归纳 问题 的 抽 丝 剥 革 ， 还 有 对 实在 论 的 质疑 。 我 
也 和 希望 阅读 这 本 书 对 你 来 说 是 一 次 不 同 寻常 的 旅程 ， 甚 至 为 你 打开 了 新 世界 的 大 
门 ， 让 你 留 下 不 可 磨灭 的 回忆 。 

最 重要 的 是 ,我 希望 你 能 沉浸 在 激情 、 着 迷 和 疑问 之 中 ， 这 就 是 本 书 的 首要 
目的 。 





























































































































































































































致谢 


创作 这 本 书 是 一 段 不 可 思议 的 旅程 ， 有 不 少 高 低 起 伏 。 如 果 没 有 那些 出 色 的 
人 的 帮助 、 支 持 以 及 他 们 分 享 的 智慧 的 话 ， 我 就 不 可 能 完成 这 一 段 旅程 。 所 以 ， 


我 深 深 感谢 他 们 。 


我 要 特别 感谢 带 博 吉 罗 、 朱 利安 ' 法 若 、 马 克 西 姆 马 约 、 达 维 德 . 洛 雷 


























罗 和 玛丽 . 英里 ,他们 仔细 校园 了 这 本 书 并 给 出 了 非常 有 用 的 反馈 。 此 外 ， 我 还 
非常 感谢 他 们 陪 着 我 对 贝 叶 斯 主义 进行 思考 。 为 此 ,我 同样 非常 感谢 佩 瓦 . 布 
FR, WUK RER, RAI + 斯 














朗 夏 尔 、 拉 希 德 . 格拉 维 、 马 赫 迪 :种 











坦 纳 、 哈 德里 安 . 亨 德里 克 斯 、 塞 巴 

















Tc 洪 格雷 、 殉 里 斯 托 夫 ' KAKRA 
































Mr + 鲁 奥 、 马 捷 ， MRES 





巴 斯 蒂 安 ， 卡拉 索 ， 以 及 其 他 人 ， 他 们 质 











疑 、 刺 激 并 磨 克 了 我 对 贝 叶 斯 主义 的 思考 。 在 我 就 职 的 瑞士 洛桑 联邦 理工 学 院 ， 
一 种 鼓励 思考 的 环境 对 我 非常 有 帮助 。 我 同样 非常 感谢 法 国 EDP Science 出 版 社 出 

















版 这 本 书 ， 还 有 末 切 的 吉尔 ， 多 维 克 拨 元 撰写 了 本 书 的 序言 。 




















此 外 ,我 还 要 感谢 所 有 在 我 身边 或 者 在 远方 关注 我 的 人 ， 尤 其 是 社交 网 络 
和 视频 网 站 上 我 的 关注 者 。 很 多 人 在 关注 我 如 何尝 试 理解 、 提 炼 那 些 我 自 认为 
理解 了 的 东西 ， 以 及 那些 我 准备 探索 的 东西 。 我 同样 要 感谢 Café des Sciences" 和 
YouTube 文化 类 频道 的 众多 伙伴 。 他 们 的 友善 和 质量 极 高 的 科普 内 容 都 是 取 之 不 


尽 的 灵感 源泉 。 
但 我 尤其 要 感谢 你 ， 亲 爱 的 读者 。 
乐 在 其 中 ， 又 深 受 鼓舞 。 











(D Café des Sciences 是 一 个 主要 由 法 语 的 网 络 科 学 普及 者 组 成 的 群体 ， 类 似 习 
会 ， 其 中 大 约 半数 为 视频 博 主 。 一 一 译 者 注 


























能 够 与 你 分 享 我 的 贝 叶 斯 主义 奇遇 ， 我 既 





F 中 国 的 科学 松鼠 


人 名 对 照 表 


阿 德尔 森 Adelson 

Tib + 沙 米 尔 Adi Shamir 

阿尔 伯 特 ， 爱 因 斯 坦 Albert Einstein 
阿尔 韦 托 . IT ik Alberto Abadie 
阿 格拉 沃 尔 Agrawal 

FT Æ Allais 

阿兰 。 爱 斯 派克 特 Alain Aspect 
阿兰 . 戴 维 斯 Alan Davies 

阿兰 .威廉 斯 Alan Williams 

FT RAAE + f# Alonzo Church 


可 





阿 罗 拉 Arora 

阿 莫 斯 . 特 沃 斯 基 Amos Tversky 
阿 斯 林 Aslin 

埃 德 温 . 杰 因 斯 Edwin Jaynes 
埃 尔 德 什 ， AR Erdós Pál 





RAR HET; Erwin Schrödinger 

FRS + 皮尔 地 Egon Pearson 

埃 利 泽 ， 尤 德 科 夫 斯 基 Eliezer Yudkowsky 
X c HE R Émile Borel 

IR A + 卡 梅 尼 察 Emir Kamenica 

348 + X48 € Albert Goldman 

艾 伯 特 ， 塔 克 Albert Tucker 

kipi + SRE Étienne Klein 

XY + Sir Airy 

艾 伦 . 图 灵 Alan Turing 


阿 列 克 谢 . 加尔 沃 年 奇 斯 Alexey Chervonenkis 


艾 萨 克 … 牛顿 Isaac Newton 

爱德华 .克拉克 Edward Clarke 

爱德华 . Ke Edward Lorenz 

爱德华 .斯 诺 登 Edward Snowden 

安 德 烈 ， 柯 尔 莫 哥 洛 夫 Andrey Kolmogorov 
安 德 烈 . 库 恩 André Kuhn 

AE + E, XE Anthony Babington 

5 4 À Olson 


奥 卡 姆 的 威廉 William of Ockham 


巴 斯 德 Pasteur 

N À € Bellman 

AH < 迪 斯 雷 利 Benjamin Disraeli 
比尔 ' 布 赖 森 Bill Bryson 

HR + 塔 特 Bill Tutte 

彼得 . 特 温 Peter Twinn 

彼得 和希 格 斯 Peter Higgs 

彼得 . 肖 尔 Peter Shor 

彼得 里 . KBA Petri Myllymäki 
毕加索 Picasso 

3k 4& X À Baudelaire 

波多 尔 斯 基 Podolski 

波恩 哈 德 . $E € Bernhard Riemann 
伯 杰 Berger 

伯 勒 斯 :斯 金 纳 Burrhus Skinner 
la Fo + 曼 德 尔 布 罗 Benoit Mandelbrot 
484 Z + Y X Bertrand Russell 


博 阿 效 . 巴 拉克 Boaz Barak 
博 斯 科 维 克 Boscovich 
布 丰 Buffon 
布 菜 效 ,帕斯卡 Blaise Pascal 
布雷 Blei 
布 林 约 尔 松 Brynjólfsson 
EE 8 + 3EW Bruno de Finetti 
布鲁斯 . AIRE + fé RATE Bruce Bueno de 


Mesquita 


策 梅 洛 Zermelo 

查尔斯 .本 内 特 Charles Bennett 

查尔斯 ， 达 
查尔斯 ， 


尔 文 Charles Darwin 
斯 坦 Charles Stein 


D 


+ 卢 阿 普尔 David Louapre 

+ i&'& Y David Loureiro 

+ 施 托 伊 雷 尔 David Steurer 
大 卫 … 休 谎 David Hume 

mt + E. Dianna Cowern 

戴 维 . 布莱克 韦 尔 David Blackwell 
RHE RI David Mermin 

RE + 项 尔 伯 特 David Hilbert 

- FA Daniel Kahneman 
+ 西蒙 斯 Daniel Simons 

+ 林 德 利 Dennis Lindley 

莱 格 利 斯 Deléglise 

+ 称 勒 Derek Muller 

3L + 汤 特 Derek Taunt 

德 伦 .布衣 Darren Brown 

tt- $Y Thibaut Giraud 

多 米 尼 克 ， 


245 $33 Dominic Johnson 


人 名 对 照 表 | 367 


E 


Æ AT + 伊 辛 Ernst Ising 


JU * & Van Gogh 

菲利普 ， HE À) Philip Merilees 

3 Fenton 

PALIER A + 瓦 普 尼克 Vladimir Vapnik 
弗兰克 Fraenkel 

弗兰克 ' 拉 姆 齐 Frank Ramsey 

?b PRA FG * 48 39 François Englert 

b Bp IG + AAA François Rabelais 

b 朗 西 斯 ， 克 里 克 Francis Crick 

弗 雷 德里 克 ， 英 斯 特 勒 Frederick Mosteller 








弗 里 德里 希 . 尼采 Friedrich Nietzsche 


高 乃依 Corneille 

X © $ It € Gordon Welchmann 

RE Ay íh + 哈代 Godfrey Harold Hardy 
格 奥 尔 格 ， He Georg Cantor 

格雷 姆 * KAA Graeme Mitchison 

格 列 效 曼 Griezmann 


古 德 曼 Goodman 


H 


哈 德 里 安 . 享 德里 克 斯 Hadrien Hendrikx 
& € + 欣 斯 利 Harry Hinsley 
PE Yi + Ap Y Jf Harold Jeffreys 


»5- X JC, f Hassanieh 
d 
Et 


b» 


Hazan 








368 | 





海 恩 斯 Haynes 

汉 斯 . ER Hans Kuhn 

DUM + 赖 欣 巴 哈 Hans Reichenbach 
DUM - 罗斯 林 Hans Rosling 

74] + Ju Henri Poincaré 
164$ 98 Al-Khwarizmi 

怀特 海 Whitehead 

惠 特 菲尔德 ， 迪 菲 Whitfield Diffie 
Æ À # Hoffman 

霍华德 ， 赖 法 Howard Raiffa 


吉尔 ， 多维 克 Gilles Dowek 
吉 洛 维 奇 Gilovich 

吉 尼 亚 克 Gignac 

加 里 . 书 尔 斯 Gary Wells 

Yt dk Aeh Jason Brennan 
杰 尔 姆 .科恩 
杰 弗 里 ， 欣 顿 Geoffrey Hinton 

杰克 “' 十 德 Jack Good 

杰 拉 人 尔 德 . 古 拉 尔 尼 克 Gerald Guralnik 
AX 714X Jerry Roberts 

REX + 英格兰 Jeremy England 

居 伊 . 德 . 莫泊桑 Guy de Maupassant 


菲尔德 Jerome Cornfield 


K 


+ A + 波 普尔 Karl Popper 

卡尔 . 弗 里 德里 希 . 高 斯 Carl Friedrich Gauss 
À + 395 € ATX Karl Friston 

AR * ÆRA Karl Pearson 


卡尔 . 萨 根 Carl Sagan 


& + 孙 达 拉 拉 麻 Kannan Soundararajan 





卡 塔 比 Katabi 


贝 叶 斯 的 博弈 : 数学 、 思 维 与 人 工 智能 


卡 修 斯 .杰克 进 ，… 
卡 亚 勒 Kayal 
康定 斯 基 Kandinsky 

康 托 尔 Cantor 

科 拉 英 Collatz 

SRE + HAE Clément Hongler 
F 48 + 香农 Claude Shannon 
克里斯蒂 亚 诺 ， 罗 纳 尔 多 
克里斯托弗 ， 查 布 里 斯 Christopher Chabris 
EPEAK © KAR Christophe Michel 
3L 2 Æ Condorcet 

库 尔 特 ， 可 德尔 Kurt Gödel 

库 斯 ， 赖 硕 勒 Marcus Raichle 


凯 泽 Cassius Jackson Keyser 


Cristiano Ronaldo 


44 P] H Lagrange 

EE + A+ Larry Page 

拉 里 ， 沃 瑟 曼 Larry Wasserman 

拉 梅 什 . 乔 哈里 Ramesh Johari 

& + 格拉 维 Rachid Guerraoui 

+ 欧 拉 Leonhard Euler 

$ + 34 + 3j #5 Leonard da Vinci 
格拉 塞 Lé0 Grasset 

JR). 兰 波 特 Leslie Lamport 

- 瓦 利安 特 Leslie Valiant 


Ru 
Š 
ği A 


莱 昂 纳 


M OM OM M 
A Xx 


兰 道 尔 . T7) Randall Munroe 
ae dX Lauren Ouellette 
Xj Wf Lebesgue 

3) JE Le Pen 

勒 让 德 Legendre 

"€ - 库 效 韦 尔 Ray Kurzweil 

雷 : 所 罗 门 诺 夫 Ray Solomonoff 
E -A R Ray Hill 


EEM + 4 Regina Nuzzo 


EK MR Rémi Peyre 

里 瓦 Rivat 

理 查 德 ， 巴 拉 纽 克 Richard Baraniuk 
道 金 斯 Richard Dawkins 

+ 4 € Richard Feynman 

+ 378 3) Richard Leibler 

+ 尼斯 比特 Richard Nisbett 

“佩带 Richard Petty 

理 查 德 . 普 赖 斯 Richard Price 

利 昂 内 尔 ， 若 斯 潘 Lionel Jospin 

+ 3, Y s. Leopold Kronecker 


& + ii E Leonard Mlodinow 

- FAX Rudolf Kálmán 

+ 克 劳 修 斯 Rudolf Clausius 

路 德 维 希 ， 玻 尔 效 曼 Ludwig Boltzmann 

+ 阿 德 曼 Leonard Adleman 

+ 萨 维 奇 Leonard Savage 

F- Až Robert Aumann 

HW * ## Robert Brout 

罗伯特 . eR Af 26 Robert Tibschirani 
& + XXE + 奥利弗 Robert Lemke Oliver 
HR 353 J Robert Schlaifer 

罗伯特 夏 派 尔 Robert Schapire 

Y (& Rohde 





Y Æ + 3 dk Roger Myerson 

罗 纳 德 . 费 希 尔 Ronald Fisher 
罗 纳 德 . 李维斯 特 Ron Rivest 
罗 林 Rosen 


Y 4 + 梅 多 Roy Meadow 


IpI + À A € Martine Aubry 
马丁 . # ARE Martin Hellman 
IT + 加 德 纳 Martin Gardner 


人 名 对 照 表 | 369 


I kib + 称 军 默 迪 El Mahdi El Mhamdi 
马 捷 ， 帕 夫 洛 维 奇 Matej Pavlovic 
马克 斯 ， 
马克 斯 " 普度 克 Max Planck 

马克 西 姆 马 约 Maxime Maillot 

蕊 库 斯 # + 索 托 伊 Marcus du Sautoy 
X45 + 4R X4} Matthew Gentzkow 

玛丽 ， 3$ Y Marie Maury 

玛丽 .斯 图 亚 特 Mary Stuart 

HME RM. 
À 3E McAfee 
迈克 尔 . 卡 恩 斯 Michael Kearns 
^R * 乔丹 Michael Jordan 
埃 尔 


纽曼 Max Newman 


萨 万 特 Marilyn vos Savant 


+ 3647 À Manuel Neuer 


+ 4&'& &- Melvin Dresher 
梅 雷 尔 . 金 特 Merel Kindt 
梅里 尔 ， 弗 勒 德 Merrill Flood 
门 捷 列 夫 Mendeleev 
Zire Et Monty Hall 

米尔 克 曼 Milkman 


RER + 洛 奈 Mickaël Launay 
fw: 鲁 凯 泽 Muriel Rukeyser 


FETE i£ Madhava 

莫 根 施 特 恩 Morgenstern 

莫 雷 诺 一 博 特 Moreno-Bote 
Xi Rf Maupertuis 

RE + £g € Murray Gell-Mann 


N 


拿破仑 . 3t $ €, Napoléon Bonaparte 
纳 齐 姆 . 塔 利 布 Nassim Taleb 

内 特 . 西 尔 弗 Nate Silver 

ÆR Knill 

尼 尔 Neil 








370 | “ 贝 叶 斯 的 博弈 : 数学 、 思 维 与 人 工 智 





JERA + 3k AR Niels Bohr 
尼古拉斯 EL Nicolas Cage 

JE + 凯 斯 Nicky Case 

JG s, - 博 斯 特 罗 姆 Nick Bostrom 

纽 波 特 Newport 

BE R39 Norman Rasmussen 


诺 姆 . 乔 姆 斯 基 Noam Chomsky 


o 


欧 内 斯 特 . F 238 Ernest Rutherford 


Tà 4T 3) Pashler 

RE + 布朗 夏 尔 Peva Blanchard 

EORR dE RI Pierre de Fermat 

RRR 一 西蒙. 拉 普 拉 斯 Pierre-Simon Laplace 
皮 安 塔 多 西 Piantadosi 

皮 亚 诺 Peano 

3-435 76 Platini 

普 热 Pouget 


齐 达 内 Zidane 

乔纳森 ， 海 特 Jonathan Haidt 

FA «E5035 Josh Tenenbaum 
乔 伊 斯 Joyce 

乔治 ， 伯克利 Georges Berkeley 
乔治， 博克 斯 George Box 

乔治 ， 英 威 格 George Zweig 

F6 - JE George Dantzig 

Fi + 克 里 斯 特 尔 George Chrystal 


琼斯 Jones 


让 ' 佩兰 Jean Perrin 


萨 克 塞 纳 Saxena 
萨 拉 Sarah 
萨 拉 ， 叉 德里 克 一 拉 布 Sara Goldrick-Rab 
萨 莉 .克拉 克 Sally Clark 
JR E, Af aede 卡拉 索 Sébastien Carassou 
ex x 
塞 德里 克 ， 维 拉 尼 Cédric Villani 

UR Y (5 € SL Af Samuel Rodriques 
莎 伦 . XU E Sharon McGrayne 


奥 Sébastien Rouault 


XR + SE Steven Pinker 
Hi 3 + E Stephen Hawking 
斯 科 特 ， TR Scott Aaronson 


斯 里 尼 瓦 萨 ， 拉 马 努 金 Srinivasa Ramanujan 
斯 坦 利 .米尔 格拉 姆 Stanley Milgram 

斯 坦 尼 斯 拉 斯 ， 德 阿 纳 Stanislas Dehaene 
MEEMAAK < 乌拉 姆 Stanislaw Ulam 
苏 格 拉 底 Socrates 

所 罗 门 ， 
所 罗 门 ， 库 尔 贝 克 Solomon Kullback 


阿 施 Solomon Asch 


塔 斯 基 Tarski 

泰勒 ， 维 根 Tyler Vigen 

汤姆 À À Tom Kibble 

汤姆 ， 西 格 弗 里 德 Tom Siegfried 
汤普森 Thompson 

唐纳德 
唐纳德 
14 4 $F Terence Tao 


Jl Y. Donald Berry 
特 朗 普 Donald Trump 


EX + A + 人 安 斯 利 Tonda Lynn Ansley 

特 奥 多 修 斯 多 布 然 斯 基 Theodosius Dobzhansky 
托马斯 ， 
托马斯 ， 
托马斯 ， 
托马斯 ， 


贝 叶 斯 Thomas Bayes 

Æ Æ #1 Thomas Jefferson 
米 科 洛 夫 Tomas Mikolov 
谢 林 Thomas Schelling 


W 


瓦 伦 Vallone 
AA + 约翰 过 Valen Johnson 

BE + 4&3& Wilhelm Lenz 

威廉 . 维 克 里 William Vickrey 

维 奥 拉 Viola 

?E SG 2 - mA Victor Hugo 

AT Weiss 

BAT fe Winston Churchill 
乌拉 姆 Ulam 

SR Vul 


X 


DZ 4€ kt Theodore Groves 
西蒙 切 利 Simoncelli 

西 摩 Seymour 

希拉 克 Chirac 

希拉 里 .克林顿 Hillary Clinton 

希 帕 索 斯 Hippasus 

JR db ded FUE Charles-Jean de la Vallée 
Poussin 

HÆ + 卡 罗 尔 Sean Carroll 

谢 尔 盖 ， 布 林 Sergey Brin 

BE + RS Cynthia Dwork 

Jk. + 埃 弗 里 特 Hugh Everett 


人 名 对 照 表 | 371 


雅 可 比 Jacobi 

雅克 ， 阿达 马 Jacques Hadamard 
雅克 ，' 拉 斯 卡尔 Jacques Laskar 
亚伯拉罕 ， 棣 英 弗 Abraham de Moivre 
亚伯拉罕 ， 瓦尔 德 Abraham Wald 
T% - 4% Adam Smith 

3E 3 $ 4 Aristotle 

LA SLA + 塔 巴 罗 克 Alex Tabarrok 
亚 历 克 西 ， 布 瓦尔 Alexis Bouvard 
亚历山大 ， 莫 雷 尔 Alexandre Maurer 
亚 林 .加 尔 Yarin Gal 

JE SÉ + Wf] Arthur Bailey 





JR H + 内 曼 Jerzy Neyman 

RE + dr 4 Ian Goodfellow 

伊丽莎白 ， 洛 夫 特 斯 Elizabeth Loftus 
伊丽莎白 一 世 Elizabeth I 

pr X. 康德 Immanuel Kant 

伊 萨 克 ，… 阿 西 英 夫 Isaac Asimov 

E] i t, Indyk 

LÆ + 博 尔 吉 达 Eugene Borgida 
Jof) Ej Jr + 4 Iulius Caesar 

JG Fo Ai * JE - 95413: Yuval Noah Harari 
犹 地 亚 ， 珀 尔 Judea Pearl 

FRIE- SU Urbain Le Verrier 

约 阿 夫 ， 弗 罗 因 德 Yoav Freund 

约翰 ' s 
约翰 .及 特 弗 里 德 . 加 勒 Johann Gottfried Galle 
约翰 ， 
约翰 .康成 John Conway 





: X4 € John von Neumann 


豪 尔 绍 尼 John Harsanyi 


2938 + 库 奇 "亚当 斯 John Couch Adams 
约翰 :洛克 John Locke 

2038 + 梅 纳 德 ， 史 密斯 John Maynard Smith 
约翰 .纳什 John Nash 











372 贝 叶 斯 的 博弈 : 数学 、 思 维 与 人 工 智 能 
2038 - 斯图尔特 密 尔 John Stuart Mill FAT + 福 勒 James Fowler 
2938 + 图 基 John Tukey 麻 姆 斯 ， 克 拉克 ,麦克 斯 书 James Clerk Maxwell 
2538 + 沃 利 斯 John Wallis Fr + 库 利 James Cooley 
约瑟夫 ， 贝 特 朗 Joseph Bertrand 朱 利 安 .法 若 Julien Fageot 
25 8 X + 4. »F Joseph Fourier 朱 利 安 . 斯 坦 纳 Julien Stainer 
朱 莉 娅 ， 加 利夫 Julia Galef 
Z KÄE H Julia Shaw 


扎 弗 兰 Saffran 


注释 和 推荐 阅读 


第 1 章 
[1] A Set-Partitioning Formulation for Community Healthcare Network Design in Underserved 
Areas. M. Cherkesly, M. E. Rancourt and K. Smilowitz (2017) 
[2] Partager un gâteau, c'est pas du gáteau!. Démocratie 22. Science4All. L. N. Hoang (2017) 
[3] Les statistiques à l'heure du Big Data. CESP Villejuif. L. N. Hoang (2016) 
[4] The Feynman Series — Beauty. Reid Gower (2011) 
[5] Conditionalisation and observation. Synthese. P. Teller (1973) 
[6] Dynamic Coherence and Probability Kinematics. Philosophy of Science. B. Skyrms (1987) 
[7] Argent, risques et paradoxes. Démocratie 12. Science4AIL. L. N. Hoang (2017) 
8] A Nonpragmatic Vindication of Probabilism. Philosophy of Science. J. Joyce (1998) 





9] Inégalité bayésienne. Axiome 9. T. Giraud, L. N. Hoang (2018) 


[ 

[ 

[10] Les algorithmes du vivant. TEDxSaclay. L. N. Hoang (2018) 
[11] Le paradoxe de Simpson. Science Étonnante. D. Louapre (2015) 
[ 


12] Utilitarisme artificiel. Axiome 3. T. Giraud et L. N. Hoang (2017) 


推荐 阅读 
Le bayésianisme aujourd'hui: Fondements et pratiques. Editions Matériologiques. I. Drouet et 
collaborateurs (2016) 
La lune n'a PAS d'influence sur les naissances (Bayésianisme). Hygiene Mentale. C. Michel (2018) 
La machine de Turing. IA 4. Science4AIl. L. N. Hoang (2017) 
Biodiversité algorithmique. Axiome 1. T. Giraud et L. N. Hoang (2017) 
Optimisme probabiliste. Axiome 2. T. Giraud et L. N. Hoang (2017) 
Probability Theory: The Logic of Science. Washington University. E. Jaynes (1996) 
Rationality: From AI to Zombies. Machine Intelligence Research Institute. E. Yadkowsky (2015) 
The Universal Turing Machine. ZettaBytes. R. Guerraoui (2016) 
Bayes: How one equation changed the way I think. J. Galef (2013) 
Think Rationally via Bayes' Rule. Big Think. J. Galef (2013) 





374 | 贝 叶 斯 的 博弈 : 数学 、 思 维 与 人 工 智能 





第 2 章 
[1] Les pigeons, rois des cons?. Science de Comptoir. M. Guillet, I. Hamchiche et V. Delattre (2016) 


[2] Le probléme des deux enfants. Math un peu ca (2017) 


推荐 阅读 

La loi de Bayes (1/2)—Argument frappant. Monsieur Phi. T. Giraud (2016) 

La loi de Bayes (2/2)—Argument frappant. Monsieur Phi. T. Giraud (2016) 

La lune n'a PAS d'influence sur les naissances (Bayésianisme). Hygiene Mentale. C. Michel (2018) 

Le paradoxe des trois portes. Math & Magique (2016) 

Quart d'Heure Insolite: le paradoxe de Monty Hall. R. Taillet (2015) 

Are Birds Smarter Than Mathematicians? Pigeons (Columba livia) Perform Optimally on a Version 
of the Monty Hall Dilemma. Journal of Comparative Psychology. W. Herbranson and J. Schroeder (2010) 

Bayes and the law. Annual Review of Statistics and Its Application. N. Fenton, M. Neil and D. 
Berger (2016) 

Conditional Probabilities: Know what you Learn. Science4AIl. L. N. Hoang (2013) 

A Formula for justice. The Guardian (online). A. Saini (2011) 

A visual guide to Bayesian thinking. J. Galef (2015) 

Your brain is not a Bayes net (and why that matters). J. Galef (2016) 

Fundamentals: Bayes’ Theorem. Critical Thinking. Wireless Philosophy. I. Olasov (2016) 

Alan and Marcus go forth and multiply. BBC (2009) 

Monty Hall Problem. Numberphile. L. Goldberg (2014) 

The Monty Hall Problem. Singingbanana. J. Grime (2009) 

The Monty Hall Problem — Explained. AsapSCIENCE (2012) 

Are you REALLY sick? (false positives). Numberphile. L. Goldberg (2016) 

The Bayesian Trap. Veritasium. D. Muller (2017) 


第 3 章 

[1] Raisonnez de facon correcte (Testez votre logique). Hygiene Mentale. C. Michel (2016) 
[2] Le paradoxe de Lewis Carroll. Grain de philo. Monsieur Phi. T. Giraud (2017) 

[3] 1 4 122 (en arithmétique de Peano). Infini 13. Science4AIL. L. N. Hoang (2016) 

[4] Les théorèmes d'incomplétude de Gödel. Infini 18. Science4AIl. L. N. Hoang (2016) 

[5] Deux (deux?) minutes pour...le théorème de Banach-Tarski. El jj. J. Cottanceau (2016) 
[6] La logique, c'est pas logique. Image des Maths CNRS. P. Colmez (2010) 





[7] From Propositional Logic to Plausible Reasoning: A Uniqueness Theorem. International Journal 


of Approximate Reasoning. K. Van Horn (2017) 


注释 和 推荐 阅读 | 375 





[8] La sagesse des forêts. IA 17. Science4All. L. N. Hoang (2017) 


推荐 阅读 

Les Métamorphoses du calcul: Une étonnante histoire des mathématiques. Le Pommier. G. Dowek (2007) 

Logicomix. Bloomsbury Publishing and Bloomsbury. A. Doxiadis, C. Papadimitriou, A. Papadatos et 
A. Di Donna (2010) 

Logique & Raisonnement. e-penser. B. Benamran (2016) 

La contraposée (sans maths). Wandida. E. M. El Mhamdi (2013) 

La négociation logique (sans maths). Wandida. E. M. El Mhamdi (2013) 

L'axiomatisation. Passe-Science. T. Cabaret (2016) 

Deux (deux?) minutes pour l’hôtel de Hilbert. El jj. J. Cottanceau (2016) 

Les théorèmes d'incomplétude de Güdel. Science Étonnante. D. Louapre (2016) 

Comment démontrer n'importe quoi. Grain de philo. Monsieur Phi. T. Giraud (2017) 

Le scepticisme—Le trilemme d'Agrippa. Grain de philo. Monsieur Phi. T. Giraud (2017) 

Le fondationnalisme—Quelle base pour l'édifice des connaissances?. Grain de philo. Monsieur Phi. 
T. Giraud (2017) 

L'axiomatique-Les Éléments d'Euclide. Grain de philo. Monsieur Phi. T. Giraud (2017) 

La règle des règles. Grain de philo. Monsieur Phi. T. Giraud (2017) 

L'infini et les fondations mathématiques (Playlist). Science4AIL. L. N. Hoang (2016) 

Les maths: invention ou découverte?. Infini 22. Science4AIl. L. N. Hoang (2017) 

La théorie des types. Infini 24. Science4AIl. L. N. Hoang (2017) 

Probability Theory: The Logic of Science. Washington University. E. Jaynes (1996) 

Homotopy Type Theory: Univalent Foundations of Mathematics. Institute for Advanced Studies. The 
Univalent Foundations Program (2013) 

Reasoning about a Rule. The Quarterly Journal of Experimental Psychology. P. Wason (1968) 

5 Stages of Accepting Constructive Mathematics. Institute for Advanced Studies. A. Bauer (2014) 

The Banach-Tarsky Paradox. VSauce. M. Stevens (2015) 

Computer Science N Mathematics (Type Theory). Computerphile. T. Altenkirch (2017) 

The Netflix Prize. ZettaBytes. A. M. Kermarrec (2017) 

Type Theory: A Modern Computable Paradigm for Math. Science4AIl. L. N. Hoang (2014) 

Homotopy Type Theory and Inductive Types. Science4AIl. L. N. Hoang (2014) 

Univalent Foundations of Mathematics. Science4AIl. L. N. Hoang (2014) 


第 4 章 
[1] Le sol accélère-t-il vraiment vers le haut?. My4Cents (Chenonceau). Science4AIL. L. N. Hoang (2016) 





376 | 贝 叶 斯 的 博弈 : 数学 、 思 维 与 人 工 智能 





[2] L'apesanteur et la pensée la plus heureuse d'Einstein. Relativité 17. Science4All. L. N. Hoang 
(2016) 

[3] Et Einstein découvrit la gravité... Relativité 20. Science4AIl. L. N. Hoang (2016) 

[4] Pas de maths, pas de chocolat!. Scilabus. V. Lalande (2015) 

[5] Comment écrire une démonstration au 21ème siècle. Math Park. Institut Henri Poincaré. L. 
Lamport (2016) 

[6] The ASA's Statement on p-values: Context, Process, and Purpose. The American Statistician. R. 
Wasserstein et N. Lazar (2016) 
[7] Comment étre sür qu'un résultat scientifique est vrai?. Science Étonnante. D. Louapre (2013) 


[8] Is Most Published Research Wrong?. Veritasium. D. Muller (2016) 





[9] Les tenseurs de la relativité générale. Hardcore. Science4All. L. N. Hoang (2016) 


Pourquoi vous perdez au casino: rencontre avec la loi des grands nombres. La statistique expliquée à 
mon chat. L. Maugeri, G. Grisi et N. Uyttendaele (2016) 

[Preuves scientifiques] P-valeur ou je fais un malheur. La statistique expliquée à mon chat. L. 
Maugeri, G. Grisi et N. Uyttendaele (2018) 

La lune n'a PAS d'influence sur les naissances (Bayésianisme). Hygiene Mentale. C. Michel (2018) 

Les statistiques à l'heure du Big Data. CESP Villejuif. L. N. Hoang (2016) 

L'Histoire de la planétologie. Relativité 2. Science4AIl. L. N. Hoang (2016) 

La relativité générale. Relativité 18. Science4AIl. L. N. Hoang (2016) 

Albert Einstein, la superstar des sciences. Science4AIl. L. N. Hoang (2016) 

A treatise of human nature. Courier Corporation. D. Hume (1738) 

An Enquiry Concerning Human Understanding. London: A. Millar. D. Hume (1738) 

The logic of scientific discovery. Routledge. K. Popper (2005) 

All of Statistics: A Concise Course in Statistical Inference. Springer Science & Business Media. L. 
Wasserman (2013) 

The Big Picture: On the Origin of Life, Meaning and the Universe Itself. Dutton. S. Carroll (2016) 

Statistical Methods for Research Workers. Genesis Publishing Pvt Ltd. R. Fisher (1925) 

On the Problem of the Most Efficient Tests of Statistical Hypotheses. Breakthroughs in Statistics. J. 
Neyman and E. Pearson (1933) 

Why Most Published Research Findings are False. PLoS Med. J. Ioannidis (2005) 

Revised Standards for Statistical Evidence. Proceedings of the National Academy of Sciences. V. 
Johnson (2013) 

Statistical Errors. Nature. R. Nuzzo (2014) 


注释 和 推荐 阅读 | 377 





Editorial. Basic Applied Social Psychology. D. Trafinow and M. Marks (2015) 

The Reproducibility Crisis in Science: A Statistical Counterattack. Significance. R. Peng (2015) 

Can I take a Peek? Continuous Monitoring of Online a/b Test. Proceedings of the 24th International 
Conference on World Wide Web. ACM. R. Johari (2015) 

Always Valid Inference: Bringing Sequential Analysis to a/b Testing. R. Johari, L. Pekelis and D. 
Walsh (2015) 

Significant. xkcd. R. Munroe 

Hypothesis Test with Statistics: Get it Right!. Science4AIl. L. N. Hoang (2013) 

Scientific Studies. Last Week Tonight. J. Oliver (2017) 


第 5 章 

[1] Frequentists vs. Bayesians. xkcd. R. Munroe 

[2] La mort du Soleil. Sense of Wonder. S. Carassou et E. Ledolley (2015) 

[3] La sur-interprétation (overfitting). IA 11. Science4AIl. C. Michel et L. N. Hoang (2018) 
[4] Deux (deux?) minutes pour l'hypothése de Riemann. El Jj. J. Cottanceau (2016) 

[5] The Scientific Case for P = NP. Shtetl-Optimized. S. Aaronson (2014) 

[6] Gene-Edited CRISPR Mushroom Escapes US Regulation. Nature. E. Waltz (2016) 

[7] La rationalisation. La Tronche en Biais. V. Tapas et T. Durand (2015) 


[8] Tous racistes? Les biais implicites. Science Étonnante. D. Louapre (2017) 





[9] Top 8 des monstres mathématiques. Infini 11. Science4AIl. L. N. Hoang (2016) 

[10] Neutrinos slower than light. Sixty Symbols. E. Copeland and T. Padilla (2012) 

[11] Le bonheur de faire des erreurs. My4Cents (Sceaux). Science4AIl. L. N. Hoang (2016) 

[12] Perception bayésienne. Axiome 9. T. Giraud et L. N. Hoang (2018) 

[13] Interview d'André Kuhn: les sciences criminelles. Podcast Science (2011) 

[14] I. M. C. “Être gros?". Risque Alpha. T. Le Magoarou (2018) 

[15] Chère conviction, mute-toi en infection VIRALE!!!. Démocratie 7. Science4All. L. N. Hoang 


(2017) 





[16] Des races dans l'humanité?. Dirty Biology. L. Grasset (2016) 

推荐 阅读 

Sommes-nous des criminels?. Petite introduction à la criminologie. Les Éditions de l'Hébe. André 
Kuhn (2005) 


Thinking Fast and Slow. SpringerFarrar, Straus and Giroux. D. Kahneman (2013) 


第 6 章 


[1] La quête mathématique de l’infiniment petit. Infini 7. Science4All. L. N. Hoang (2016) 





378 | 贝 叶 斯 的 博弈 : 数学 、 思 维 与 人 工 智能 





[2] The Zipf Mystery. VSauce. M. Stevens (2015) 
[3] Jouvence conflictuelle. Axiome 5. T. Giraud et L. N. Hoang (2017) 


] 
] 
[4] Le décryptage d'Enigma. Science4AIl. R. Barbulescu et L. N. Hoang (2017) 
[5] Humains versus machines. IA 1. Science4AIl. L. N. Hoang (2017) 

] 


[6] A History of Bayes' Theorem. Less Wrong. lukeprog (2011) 


Mémoire sur la probabilité des causes par les événements. Imprimerie Royale. P. S. Laplace (1774) 

Théorie analytique des probabilités. V. Courcier. P. S. Laplace (1812) 

Essai philosophique sur les probabilités. Bachelier. P. S. Laplace (1840) 

Peut-on mathématiquement prédire l'avenir du systéme solaire?. Espace des sciences. C. Villani 
(2014) 

La mort du Soleil. Sense of Wonder. S. Carassou et E. Ledolley (2015) 

Le théoréme central limite. La statistique expliquée à mon chat. L. Maugeri, G. Grisi et N. 
Uyttendaele (2017) 

The Doctrine of Chances: or, A Method of Calculating the Probability of Events in Play. W. Pearson. 
A. de Moivre (1718) 

The Foundations of Statistics. Wiley Publications in Statistics. L. Savage (1950) 

Game Theory and Economic Behavior. Princeton University Press. J. von Neumann et O. 
Morgenstern (1944) 

Applied Statistical Decision Theory. MIT Press. H. Raiffa et R. Schlaifer (1944) 

The Unfinished Game: Pascal, Fermat, and the Seventeenth-Century Letter that Made the World 
Modern. Basic Books; First Trade Paper Edition. K. Devlin (2010) 

The Theory that would not Die: How Bayes' Rule Cracked the Enigma Code, Hunted down Russian 
Submarines, and Emerged Triumphant from two Centuries of Controversy. Yale University Press. S. 
McGrayne (2011) 

The Influence of Ultra in the Second World War. Cambridge Security Group Seminar. H. Hinsley (1993) 

Credibility Procedures: Laplace's Generalization of Bayes' Rule and the Combination of Collateral 
Knowledge with Observed Data. New York State Insurance Department. A. Bailey (1950) 

Smoking and Lung Cancer: Recent Evidence and a Discussion of some Questions. International 
Journal of Epidemiology. J. Cornfield, W. Haenszel, C. Hammond, A. Lilienfeld, M. Shimkin, and E. L 
Wynder (1959) 

Algorithmic probability: Theory and Applications. Information Theory and Statistical Learning. 
Springer. R. Solomonoff (2009) 


Mathematicians: Blaise Pascal. Singingbanana. J. Grime (2009) 


注释 和 推荐 阅读 | 379 





Confidence Interval for the Mean. Wandida. J. Y. Le Boudec (2016) 


第 7 章 

[1] La diagonale dévastatrice de Cantor. Infini 16. Science4All. L. N. Hoang (2016) 

[2] Les théorèmes d'incomplétude de Gödel. Infini 18. Science4AIl. L. N. Hoang (2016) 
[3] Making a computer Turing complete. B. Eater (2018) 

[4] La machine de Turing. IA 4. Science4AIl. L. N. Hoang (2017) 

[5] A Curious Pattern Indeed. 3Bluel Brown. Grant Sanderson (2015) 

[6] La machine de Turing. Passe-Science. T. Cabaret (2015) 

[7] Two views of brain function. Trends in Cognitive Sciences. M. Raichle (2010) 


[8] How do computers work? The Von Neumann Architecture. Solid State Tech (2017) 





[9] Top 5 des problémes de maths simples mais non résolus. Micmaths. M. Launay (2016) 
[10] Incomplétude. Passe-Science. T. Cabaret (2015) 

[11] La logique ne suffit pas. IA 6. Science4AIl. L. N. Hoang (2018) 

[12] Why Philosophers Should Care About Computational Complexity. S. Aaronson (2011) 


推荐 阅读 

Les Métamorphoses du calcul: Une étonnante histoire des mathématiques. Le Pommier. G. Dowek 
(2007) 

Introduction à la calculabilité - la machine de Turing. Wandida. R. Guerraoui (2013) 

Alan Turing - Enigma, ordinateur et pomme empoisonnée. e-penser. B. Benamran (2015) 

Les machines de Turing. Math & Magique (2016) 

Linguistique causale. Axiome 7. T. Giraud et L. N. Hoang (2018) 

A preliminary report on a general theory of inductive inference (Report ZTB138). Zator Co. R. 
Solomonoff (1960) 

A formal theory of inductive inference. Part I. Information and Control. R. Solomonoff (1964) 

A formal theory of inductive inference. Part II. Information and control. R. Solomonoff (1964) 

The discovery of algorithmic probability. Journal of Computer and System Sciences. R. Solomonoff 
(1997) 

Algorithmic probability: Theory and applications. Information theory and statistical learning. R. 
Solomonoff (2009) 

Quantum Computing since Democritus. Cambridge University Press. S. Aaronson (2013) 

The Universal Turing Machine. ZettaBytes. R. Guerraoui (2016) 

Turing and the Halting Problem. Computerphile. M. Jago (2014) 


Circle Division Solution. 3Bluel Brown. Grant Sanderson (2015) 


380 





| 贝 叶 斯 的 博弈 : 数学 、 思 维 与 人 工 智能 





第 8 章 

[1] 10 prouesses de la cryptographie. Crypto. String Theory. L. N. Hoang (2018) 
[2] Il donne du cannabis à son chat, ça tourne mal. La statistique expliquée à mon chat (2017) 
[3] What is Privacy?. Wandida. L. N. Hoang (2017) 

[4] Interpretation of and 6’s of Differential Privacy (Proof). Wandida. L. N. Hoang (2017) 

[5] The Big Data Setup of the Human Brain Project. ZettaBytes. A. Ailamaki (2017) 


推荐 阅读 
Le principe du chiffrement par clefs asymétriques. Wandida. E. M. El Mhamdi (2014) 
L'arithmétique utilisée par le chiffrement par clefs asymétriques. Wandida. E. M. El Mhamdi (2014) 
Les codes secrets. Science Étonnante. D. Louapre (2015) 

Le décryptage d'Enigma. Science4AIl. R. Barbulescu et L. N. Hoang (2017) 

Differential privacy. Automata, languages and programming. C. Dwork (2006) 

Differential privacy. Encyclopedia of Cryptography and Security. Springer US. C. Dwork (2011) 


The algorithmic foundations of differential privacy. Foundations and Trends@ in Theoretical 


Computer Science. C. Dwork and A. Roth (2014) 


An Embarrassing Survey - Randomized Response. Singingbanana. J. Grime (2010) 
Mathematics of Codes and Code-Breaking. Singingbanana. J. Grime (2012) Maths from the talk 


"Alan Turing and the Enigma Machine". Singingbanana. J. Grime (2013) 


Diffie-Hellman Key Exchange. Wandida. J. Goubault-Larrecq (2014) 

The Diffie-Hellman Protocol. ZettaBytes. S. Vaudenay (2016) 

Differential Privacy. Playlist. Wandida. L. N. Hoang (2017) 

The Formal Definition of Differential Privacy. Wandida. L. N. Hoang (2017) 

A Simple Differentially-Private Randomized Survey. Wandida. L. N. Hoang (2017) 
Interpretation of and 5 s of Differential Privacy. Wandida. L. N. Hoang (2017) 


第 9 章 


[1] Measuring Unfairness Feeling in Allocation Problems. Omega. L. N. Hoang, F. Soumis et G. 


Zaccour (2016) 


[2] The Golden Rule. Radio Lab (2017) 
[3] Favoriser l'honnéteté. Démocratie 18. Science4AIl. L. N. Hoang (2017) 


[4] Socialement optimal: le mécanisme VCG. Démocratie 20. Science4AIl. L. N. Hoang (2017) 





[5] La négociation optimale. Démocratie 19. Science4AIl. L. N. Hoang (2017) 


注释 和 推荐 阅读 | 381 





推荐 阅读 

La théorie des jeux. Science Étonnante. D. Louapre (2017) 

La vidéo pas dróle mais intéressante. Squeezie. L. Hauchard (2017) 

La démocratie sous l'angle de la théorie des jeux. Science4AIl. L. N. Hoang (2017) 

L'équilibre de Nash. Démocratie 13. Science4AIL. L. N. Hoang (2017) 

Le poker résolu! (ou non). Démocratie 15. Science4AIl. L. N. Hoang (2017) 

La démocratie à la moulinette des maths et de la science. Podcast Science 84. N. Tupégabet, D. 
Medernach et A. Vonlanthen (2012) 

Jeux. Podcast Science 214. R. Jamet (2015) 

Equilibrium points in n-person games. Proceedings of the National Academy of Science. J. Nash 
(1950) 

Non-cooperative games. Annals of mathematics. J. Nash (1951) 

Subjectivity and correlation in randomized strategies. Journal of Mathematical Economics. R. 
Aumann (1974) 

Games with randomly disturbed payoffs: A new rationale for mixed-strategy equilibrium points. 
International Journal of Game Theory. J. Harsanyi (1973) 

Optimal auction design. Mathematics of Operations Research. R. Myerson (1981) 

Comments on “Games with Incomplete Information Played by ‘Bayesian’ Players, I-II! Harsanyi's 
Games with Incomplete Information". Management Science. R. Myerson (2004) 

Bayesian persuasion. The American Economic Review. E. Kamenica and M. Gentzkow (2011) 

The Evolution of Trust. ncase. Nicky Case (2017) 

Game Theory and the Nash Equilibrium. Science4All. L. N. Hoang (2012) 

Bayesian Games: Math Models for Poker. Science4All. L. N. Hoang (2012) 

Mechanism Design and the Revelation Principle. Science4AIl. L. N. Hoang (2012) 

A Mathematical Guide to Selling. Science4All. L. N. Hoang (2015) 


第 10 章 

[1] How not to be ignorant about the world. TED. H. Rosling et O. Rosling (2014) 

[2] Khan Academy and the Effectiveness of Science Videos. Veritasium. D. Muller (2011) 

[3] La Terre est-elle le centre du monde?. Relativité 14. Science4AIl. L. N. Hoang (2016) 

[4] La géométrie hyperbolique. Relativité 12. Science4AIl. L. N. Hoang (2016) 

[5] Et Einstein découvrit la gravité...Infini 20. Science4AIl. L. N. Hoang (2016) 

[6] La fin du monde et la plus grosse bêtise d'Einstein. Relativité 21. Science4AIl. L. N. Hoang 
(2016) 





[7] 4 paradoxes de la logique mathématique. Infini 17. Science4AIl. L. N. Hoang (2017) 





382 贝 叶 斯 的 博弈 : 数学 、 思 维 与 人 工 智能 





Numbers and Constructibiliy. Science4AIl. L. N. Hoang (2013) 

[8] How I use *meta-updating". J. Galef (2015) 

[9] Chère conviction, mute-toi en infection VIRALE!!!. Démocratie 7. Science4All. L. N. Hoang 
(2017) 

[10] Post-Truth: Why Facts Don't Matter Anymore. Veritasium. D. Muller (2016) 

[11] This Video Will Make You Angry. CGP Grey (2015) 

[12] Experimental evidence of massive-scale emotional contagion through social networks. PNAS. 
A. Kramer, J. Guillory and J. Hancock (2014) 

[13]What Makes Online Content Viral?. Journal of Marketing Research. J. Berger and K. Milkman 
(2012) 

[14] Partisanship and Political Animosity in 2016. U.S. Politics & Policy. Pew Research Center 
(2016) 

[15] Rationnellement irrationel Démocratie 11. Science4AIl. L. N. Hoang (2017) 

[16] Un singe ferait-il mieux que votre conseiller financier?. Science Étonnante. D. Louapre (2013) 

[17] Thinking Fast and Slow. SpringerFarrar, Straus and Giroux. D. Kahneman (2013) 

[18] What causes economic bubbles?. Ted-Ed. P. Singh (2015) 





[19] Les Subprimes lére Partie: La boulette!. Heu?reka. G. Mitteau (2017) 


推荐 阅读 

Les arguments fallacieux. Hygiene Mentale. C. Michel (2016) 

Les OGMs sont-ils nocifs? (non). Dirty Biology. L. Grasset (2016) 

Biotope et Équilibre Proies—Prédateurs. Goana (2017) 

Les Subprimes 2ème Partie: Une crise imprévisible. Heu?reka. G. Mitteau (2017) 

Les Subprimes 3éme Partie: Ceux qui ont prédit la crise. Heu?reka. G. Mitteau (2017) 

Petit communautarisme deviendra grand. Démocratie 6. Science4AIl. L. N. Hoang (2017) 

Le paradoxe de la morale. Démocratie 25. Science4AIl. S. Debove et L. N. Hoang (2017) 

Designing Effective Multimedia for Physics Education. University of Sydney. PhD Thesis. D. Muller 
(2008) 

The theory of games and the evolution of animal conflicts. Journal of Theoretical Biology. J. M. 
Smith (1974) 

What Makes Online Content Viral?. Journal of Marketing Research. J. Berger and K. Milkman 
(2012) 

Rock Paper LIZARDS. Numberphile. H. Fry (2015) 

Is America More Divided Than Ever?. The Good Stuff (2016) 

That Time Tulips Crashed the Economy (Maybe). The Good Stuff (2018) 


注释 和 推荐 阅读 | 383 





Partisanship and Political Animosity in 2016. Pew Research (2016) 
Evolutionary Game Theory. Science4All. L. N. Hoang (2012) 


第 11 章 
[1] L'argent fait-il le bonheur?. Stupid Economics. V. Levetti et A. Gantier (2017) 
[2] The singularity is near: When humans transcend biology. Penguin. R. Kurzweil (2005) 
[3] La Légende de Sessa. Scienticfiz (2017) 
[4] Modelling the recent common ancestry of all living humans. Nature. D. Rohde, S. Olson, et J. 
Chang (2004) 
[5] Vous étes de sang royal. Dirty Biology. L. Grasset (2018) 
[6] How many particles in the universe?. Numberphile. T. Padilla (2017) 
[7]Immortalité — surpopulation...ou pas?. Alexandre Technoprog. A. Maurer (2017) 
[8] DNA Encoding. ZettaBytes. C. Dessimoz (2018) 





[9] La loi de Benford. Passe-Science. T. Cabaret (2015) 

[10] De quoi le succés d'une chaine YouTube de vulgarisation dépend-il?. Science Étonnante. D. 
Louapre (2017) 

[11] Addition contre multiplication. MicMaths. M. Launay (2014) 

[12] The Multiplicative Weights Update Method: a Meta-Algorithm and Applications. Theory of 
Computing. S. Arora, E. Hazan and S. Kale (2012) 

[13] The law of group polarization. Journal of Political Philosophy. C. Sunstein (2002) 

[14] Humains versus machines. IA 1. Science4AIl. L. N. Hoang (2017) 

[15] What Will the Future of Jobs Look Like?. TED. A. McAfee (2013) 





[16] What is Singularity, Exactly?. Up and Atom. J. Tan-Holmes (2018) 


推荐 阅读 

Le grand roman des maths: de la préhistoire a nos jours. Flammarion. M. Launay (2016) 

Merveilleux logarithmes. MicMaths. M. Launay (2014) 

Le top 5 des études de psychologie sociale qui vous feront requestionner les choses. Outside The 
Box (2015) 

Êtes-vous un hooligan politique?. Démocratie 10. Science4All. L. N. Hoang (2017) 

The Second Machine Age: Work, Progress, and Prosperity in a Time of Brilliant Technologies. W. W. 
Norton & Company. E. Brynjolfsson and A. McAfee (2005) 

Superintelligence: Paths, Dangers, Strategies. Oxford University Press. N. Bostrom (2014) 

Universal Paperclips. Decision Problem. F. Lantz (2007) 

Humans Need Not Apply. CGP Grey (2014) 





384 | 贝 叶 斯 的 博弈 : 数学 、 思 维 与 人 工 智能 





The Accelerating Future. R. Kurzweil (2010) 

The Multiplicative Weights Update Algorithm. Wandida. L. N. Hoang (2016) 

Motivations and Applications of the Multiplicative Weights. Wandida. L. N. Hoang (2016) 
Theoretical Guarantee for the Multiplicative Weights Update. Wandida. L. N. Hoang (2016) 


第 12 章 
[1] Sommes-nous des simulations? L "argument de la simulation de Nick Bostrom. Argument Frappant. 
Monsieur Phi. T. Giraud (2016) 
[2] Is anything real?. VSauce. M. Stevens (2013) 
[3] Hack your way to scientific glory. FiveThirtyEight (2015) 
[4] La sur-interprétation (overfitting). IA 11. Science4AIl. C. Michel et L. N. Hoang (2018) 
[5] Êtes-vous un hooligan politique?. Démocratie 10. Science4AIl. L. N. Hoang (2017) 
[6] La loi de la chute des corps. Relativité 13. L. N. Hoang (2016) 
[7] La Terre est-elle au centre du monde?. Relativité 14. L. N. Hoang (2016) 
[8] Le poker résolu! (ou non). Démocratie 15. Science4AIl. L. N. Hoang (2017) 





[9] Le théorème fondamental de l'apprentissage statistique. IA 15. Science4All. L. N. Hoang (2018) 
[10] Les explications ad hoc (dimension VC). IA 14. Science4AIl. L. N. Hoang (2018) 
[11] Gros Tony et Dr. John (dilemme biais-variance). IA 12. Science4AIl. G. Mitteau et L. N. Hoang 
(2018) 
[12] La validation croisée. IA 13. Science4AIl. La statistique expliquée à mon chat et L. N. Hoang 
(2018) 
13]Régressions et classifications linéaires. IA 9. Science4AIl. L. N. Hoang (2018) 
14] Régularisation et robustesse. IA 18. Science4AIl. L. N. Hoang (2018) 


16] The Netflix Prize. ZettaBytes. A. M. Kermarrec (2017) 





[ 
[ 
[15] La sagesse des forêts. IA 17. Science4All. L. N. Hoang (2018) 
[ 
[ 


17] Admissibility and complete classes. P. Hoff (2013) 


推荐 阅读 

Informatique et jeux. Passe-Science. T. Cabaret (2016) 

Jeu de go et intelligence artificielle. À chaud. Science Étonnante. D. Louapre (2016) 

Deux (deux?) minutes pour l'éléphant de Fermi & Neumann. El Jj. J. Cottanceau (2018) 

Les learning machines de Turing. IA 7. Science4All. L. N. Hoang (2018) 

The Righteous Mind: Why Good People are Divided by Politics and Religion. Vintage. J. Haidt 
(2013) 


Understanding Machine Learning: From Theory to Algorithms. Cambridge University Press. S. 


注释 和 推荐 阅读 | 385 





Shalev-Shwartz and S. Ben-David (2016) 

Uncertainty in deep learning. PhD Thesis. University of Cambridge. Y. Gal (2016) 

Regression shrinkage and selection via the lasso. Journal of the Royal Statistical Society. R. 
Tibshirani (1996) 

Spurious Correlations. Tyler Vigen 


The fundamental theorem of statistical learning. Wandida. L. N. Hoang (2017) 


第 13 章 
[1] Le paradoxe de Simpson. Science Étonnante. D. Louapre (2015) 
[2] Satanés facteurs de confusion. IA 17. Science4All. L. N. Hoang (2018) 
[3] Chocolat, corrélation et moustache de chat. La statistique expliquée à mon chat. L. Maugeri, G. 
Grisi et N. Uyttendaele (2016) 
[4] How statistics can be misleading. Ted-Ed. M. Lidell (2016) 
[5] Interview d'André Kuhn: les sciences criminelles. Podcast Science (2011) 
[6] Is Punishment or Reward More Effective? Veritasium. D. Muller (2013) 
[7] Research Student Aid Before You Reform. Chronicle of Higher Education. A. Kelly (2012) 
[8] Need-based financial aid and college persistence: Experimental evidence from Wisconsin. S. 


Goldrick-Rab, D. Harris, J. Benson and R. Kelchen (2012) 





[9] Google's Artificial Brain Learns to Find Cat Videos. Wired. Liat Clark (2012) 
[10] Sommes-nous humains? Dirty Biology. L. Grasset (2015) 


推荐 阅读 

Tu bois du light? T'es foutu! La statistique expliquée à mon chat. L. Maugeri, G. Grisi et N. Uyttendaele 
(2017) 

James Lind - L'essai clinique. Risque Alpha. T. Le Magoarou (2017) 

Solution du paradoxe de Simpson. Science4AIl. L. N. Hoang (2018) 
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